Symskan

文獻相似度檢索服務

▋▎Symskan 是什麼?

Symskan 是比對著作相似程度的系統,當我們上傳自己的文件後,就能知道自己和別人著作相似的百分比。比對著作的來源以華藝線上圖書館中收錄的資料為主,包含數千種期刊與會議論文,還有數十所大專院校的學位論文。

▋▎什麼時候需要 Symskan?

想了解自己著作的原創性時;想確認自己或他人是否有抄襲時;學位論文付梓之前。

▋▎為什麼要用 Symskan?

▋▎誰可能對 Symskan 心動?

準備要論文口試的研究生;準備擔任口試委員的老師;著作的編輯或審查委員。

▋▎怎麼使用 Symskan?

【重要】

註冊帳號前,請一定要先登入圖書館電子資源查詢系統,再連到 Symskan 註冊帳號,否則會出現錯誤訊息:

從下面的傳送門過去,就可以先登入電子資源查詢系統頁面後轉到 Symskan:

電子資源查詢系統帳號:學號九碼,都是數字

電子資源查詢系統密碼:預設為手機後四碼

登入時碰到問題,平日上班時間可洽 02-28961000 # 1832 林小姐或 email詢問 :D

1.   註冊

①  點擊【登入】下面的【一般使用者登入/註冊】

②  確認右上角有出現「國立台北藝術大學」字樣

★  有從北藝大圖書館電子資源查詢系統登入就會出現

③  點擊【立即註冊】

★  請不要點 Google 註冊,不然系統會抓不到您是北藝的使用者 QwQ

④  輸入常用信箱作為帳號,自訂密碼,選擇機構單位系所與身分後,點擊【確定】

★  密碼長度限 6-16 個半形字母,不能有符號

 資訊無誤點擊【確認】繼續,有錯點擊【重新輸入】修改

⑥  看到成功訊息後點擊【確認】,登入常用信箱(剛剛註冊的帳號)接收系統發送的認證信

⑦  點擊認證信的【進行認證】

⑧  看到「Email驗證成功」訊息後點即【確定】即完成註冊

2.   登入與個人化設定

①  點擊【登入】下面的【一般使用者登入/註冊】

②  右方「使用者登入」區塊輸入帳號與密碼後點擊下方【登入】

③  登入後會直接進到「文檔管理」頁面

④  點擊右上【個人化設定】,可以修改密碼、綁定 Google 帳號、延長校外登入的時間

★  如果是從圖書館電子資源查詢系統連到 Symskan,就不用管延長校外登入的選項~

3.   上傳檔案

①  在「文檔管理」的頁面,點擊右上角【上傳檔案】

②  點擊下方【瀏覽檔案】

★  提醒:目前僅支援 100 字以上,至少兩頁之 未加密 DOC、DOCX、PDF文檔,一次最多上傳 5 筆文檔,總計大小需小於 50 MB

★  每筆上傳的檔案會 保留 30 天,30 天後檔案和比對報告會自動從伺服器刪除;倒數 7 天起會有粉紅底色標示提醒

③  點一下要比對的檔案名稱,再點「開啟」

④  文檔上傳區出現剛剛的檔案,驗證出現「可比對」表示沒有問題,可以點擊下方【送出比對】繼續

  成功送出比對會出現確認視窗,點擊下方【確認】或右上【X】可關閉視窗

★  比對時間約 5-10 分鐘,但檔案大或系統流量大時(如畢業季)會需要更久的時間

★  比對完成後系統會以 email 通知,還會附上簡易比對報告書,可以先看到原創/相似分

★  還沒處理完成時,文檔管理頁面可以看到「進度」顯示為:處理中

⑥  前面有提醒上傳的文件檔要 未加密,那如果上傳了加密的文件檔會如何呢?

★  加密:設定密碼保全以限制他人開啟或複製我的文件內容

⑦  上傳加密文件檔會驗證失敗,無法送出比對der

★  把滑鼠游標移到驗證失敗旁的  i  圖示,可以看到失敗的原因;通常是「已加密」、「未達兩頁」或「字元至少 300 字」

★  點擊【移除】就可以把檔案刪掉

⑧  收到相似度檢測完成通知的 email 後,就可進入系統查看比對報告

4.   檢視比對報告

①  滑鼠游標移到比對完成的項目,點一下就可以進到比對報告頁面

★  總相似度百分比僅供參考,不過 數值越高越不妙

★  總相似度 = 加總全部來源小句子去除重複部分的字數 / 加總全部來源句子的字數(可比對的部分)

    ★  ↑↑↑  很困惑對吧ˊ_>ˋ 請點我看完整的說明

②  左側上傳文檔段落,可對應 編號 檢查右側相似文獻,還有兩者的文章相似度

★  文章相似度:上傳文檔與單篇文章相似的比例

★  請注意編號沒有錨點功能,要手動去右側相似文獻來源找到相對應的編號

③  相似文獻來源的清單中,可以看到【檢視來源】和【詳細資料】兩種資訊

★  檢視來源:連到「華藝線上圖書館」資料庫,可查看文章的書目和摘要;如果是圖書館有訂閱的內容,還可以下載全文

★  詳細資料:直接列出相似文獻中,和上傳文檔相似的段落

④  點進某篇文獻的【詳細資料】以後:

★  右側上方可以看到該篇文獻在相似文獻來源清單中的編號

★   右側上方也有【檢視來源】可以連到華藝線上圖書館查看書目,部分可下載全文

★  右側中段會列出這篇文章裡面和上傳文檔相似的段落。如果這篇文獻找到多個相似段落,會依順序列出,以字母標號

★  請點擊右側來源文獻的相似段落連結,左側上傳文檔區才會跟著跳到相似段落

 單篇文章<1%的相似度比對結果,常常都是因為專有名詞、機構名稱、參考書目等不具抄襲意義的詞句,建議可以用右上的【設定】來排除

★  排除參考書目(參考文獻):已預設為勾選 

★  排除包含以下數值的相似來源文獻:可選擇 <1%、1%、2%、3% 的門檻來整批排除,總相似度會因此改變

★  提醒:請依學科領域特性設定適當的百分比,建議跟您的指導教授討論

5.   下載比對報告

①  滑鼠點擊【下載報告】,可選擇要【全文下載】或【段落下載】,勾好之後點擊【完成】

★  「作者名稱」為必填欄位,但只要有填東西就好

★  各別下載會是 PDF 檔,兩個都勾則會下載一包壓縮檔(ZIP檔)

★  全文報告: 總相似度 + 文章相似度 + 相似文獻篇數 + 相似段落個數 + 標示全文中相似段落

★  段落報告: 總相似度 + 文章相似度 + 相似文獻篇數 + 相似段落個數 + 相似段落一覽

★  全文報告檔案大小會比當初上傳的文檔大很多

②  如果有用【設定】中「排除包含以下數值的相似來源文獻」的功能,報告仍會顯示已被排除的段落

▋▎Q&A

Q1:如果我沒有收到帳號啟動認證信件該怎麼辦?

A1:先檢查垃圾信件匣,確認都沒收到,再回到首頁點擊【立即使用】,再點一下【沒有收到認證信】並輸入申請時用的 e-mail,系統會再發一次認證信件;如果還是沒收到,請寄信通知客服:plc@airiti.com,他們會重新寄送通知或手動幫忙啟動。

Q2:為什麼有的相似文獻只有【檢視來源】沒有【詳細資料】

A2有些文獻只有【檢視來源】沒有【詳細資料】,是因為文章授權的問題,系統只能告訴我們相似的百分比,但不能將文章的相似內容列出來;這種文獻通常都是學位論文。

Q3:總相似度到底是怎麼算的?文章相似度又是怎麼算的?

A3總相似度白話一點來說,就是「我的文章裡有多少百分比的內容不是我自己的東西」;文章相似度則是「我的文章裡有多少百分比的內容是某篇文章裡的東西」。

Symskan根據上述邏輯,去比對使用者上傳的文檔 v.s.  Symskan 背後來源文獻庫中的文章;比對時是以上傳文檔的「句子」為單位,且句子字元數要達到35(標點也要算),Symskan 才會啟動比對機制,把這個句子丟到文獻庫去和其他文章做比對。舉例來說,今天天氣很好,所以跑去大吃了一頓。字的這句話含標點有 17 個字元,因未達 35,所以不會進行相似度比對。

(大吃一頓錯惹嗎)

現在假設我上傳了一個文檔,全文有 214 字元,共 6 個句子。

(…我們先假裝系統沒有上傳文檔要 300 字以上的限制(゚д゚;))

【文檔內容】

第一句

1079 年,蘇軾被貶謫到黃州(今湖北黃岡),於 1082 年寫下了這篇好作品,oxoxoxoxoxoxoxox。〔共 54 個字元〕

第二句

作品描寫的是蘇軾與客人泛舟赤壁,談論赤壁之戰,進而至天地人生的過程,oxoxoxoxoxoxoxox。〔共 51 個字元〕

三句

壬戌之秋,七月既望,蘇子與客泛舟遊於赤壁之下,oxoxoxoxoxoxoxox。〔共 40 個字元〕

四句

楷書,能自創新意,用筆豐腴跌宕。〔共 16 個字元〕

五句

釃酒臨江,橫槊賦詩,固一世之雄也,而今安在哉?〔共 23 個字元〕

六句

蘇子曰:客亦知夫水與月乎?逝者如斯,而未嘗往也;盈虛者如彼。〔共 30 個字元〕

下面我們先來看看總相似度計算的例子:

比對第一句的時候,Symskan 找到一篇相似文章(下稱 A 文章),A 文章裡有兩個地方和我上傳的文檔相似:

註:色底是我上傳文檔的文字,編號上色部分表示在相似文章中找到的相似部分

A 文章的段落 2 裡,找到了相似文字寫下了這篇好作品,上傳文檔第一句累計相似字元數:8

A 文章的段落 7 裡,找到了相似文字1082 年寫下了這篇好作品,上傳文檔第一累計相似字元數:13

寫下了這篇好作品這 8 個字和 A 文章裡的段落 2 重複,所以不計,累計 8 + 5 = 13)

比對二句的時候,Symskan 沒有找到相似的文章,累計相似字元數:0。

比對三句的時候,Symskan 找到篇相似文章(下稱 A 文章、B 文章、C 文章、D 文章)

註:編號上色部分表示在相似文章中找到的相似部分

A 文章的段落 10 裡,找到了相似文字:七月既望,上傳文檔累計相似字元數:4

A 文章的段落 17 裡,找到了相似文字:壬戌之秋,七月既望,上傳文檔第三句累計相似字元數:9

七月既望4 個字和 A 文章裡的段落 10 重複,所以不計,累計 4 + 5 = 9

B 文章的段落 20 裡,找到了相似文字:壬戌之秋,七月既望,上傳文檔第三句累計相似字元數:9

壬戌之秋,七月既望9 個字和 A 文章裡的段落 10、17 重複,所以不計,累計不變

C 文章的段落 35 裡,找到了相似文字:泛舟遊於赤壁,上傳文檔第三句累計相似字元數:15

(累計 4 + 5 + 6 = 15

D 文章的段落 8 裡,找到了相似文字:泛舟遊於赤壁之下,上傳文檔第三句累計相似字元數:18

泛舟遊於赤壁6 個字和 C 文章裡的段落 35 重複,所以不計,累計 4 + 5 + 6 + 3 = 18

不滿 35 個字,未達門檻不比對

不滿 35 個字,未達門檻不比對。

不滿 35 個字,未達門檻不比對。

總結一下:

上傳文檔和其他文章相似的內容:第一句,13 字元;第二句,0 字元;第三句,18 字元;第四句第五句第六句免比

上傳文檔各句文字的字元數:第一句54 字元;第二句51 字元;第三句40 字元;第四句第五句第六句免算

現在我們可以算總相似度了!

上傳文檔和其他文章相似的內容 = 13 + 0 + 18 = 31

上傳文檔各句文字的字元數 = 54 + 51 + 40 = 145

總相似度 = ( 31 / 145 ) * 100 %,四捨五入取整數 = 21%

現在我們來看看文章相似度的計算:

和總相似度一樣,未達 35 字元數門檻的句子不進行比對不進行加總計算重複的字元只會算一次我們就沿用上面的例子,來算算 A、B、C、D 這4篇相似文獻分別和我上傳文檔的文章相似度。

A 文章 = ( 13 + 9 ) / 145  * 100 %,四捨五入取整數 = 15%

詳解:上傳文檔第一句有 13 字元和 A 文章相似,第三句有 9 字元,加總後除以上傳文檔達比對門檻的總字元數 145 字元。

B 文章 = 9 / 145  * 100 %,四捨五入取整數 = 6%

詳解:上傳文檔9 字元和 B 文章相似,除以上傳文檔達比對門檻的總字元數 145 字元。

C 文章 = 6 / 145  * 100 %,四捨五入取整數 = 4%

詳解:上傳文檔第三句6 字元和 C 文章相似,除以上傳文檔達比對門檻的總字元數 145 字元。

D 文章 = 9 / 145  * 100 %,四捨五入取整數 = 6%

詳解:上傳文檔第三句9 字元和 D 文章相似,除以上傳文檔達比對門檻的總字元數 145 字元。


總結一下,算式大概是這樣:

謝謝各位看完如此落落長的說明。