最新消息

    這裡所分享之軟體可處理中、英、日、韓文等多國語文資料,依 Creative Commons License 條款授權使用 (請引用)
    
    TaiwanDH is a set of tools for handling text files encoded in UTF-8. Samples of Chinese (literary and modern), English, Japanese, and Korean documents are provided for your exploration.
  1. 2016年05月18日:TaiwanDH 2016 研習主題:多重面向分析與關鍵陳述擷取。感謝主辦單位國立清華大學中國文學系臺灣數位人文學會科技部數位人文數位人文籌畫小組之協助:(六月三日) 研習活動公告網頁
  2. 2016年04月24日:國立台灣大學夏季學院課程「認識數位人文
  3. 2016年04月24日:臺灣數位人文學會第一屆會員大會於今日假國立臺灣師範大學舉行
  4. April 24, 2016:Inaugural general meeting of the Taiwanese Association for Digital Humanities
  5. 2016年04月23日:TaiwanDH 2016 研習主題:多重面向分析與關鍵陳述擷取。感謝主辦單位國立中正大學中國文學系科技部數位人文數位人文籌畫小組之協助:(四月三十日) 研習活動公告網頁。「多重面向分析」讓您以自己訂定的研究角度來分析文本內容;「關鍵陳述擷取」則是進一步協助您找出文本之中的核心陳述 (statements)。
  6. April 23, 2016: TaiwanDH offers new tools for analyzing corpora from multiple facets of researchers' choices. New tools will also help the identification and extraction of core statements that are highly related to the research issues. Please join the workshop that will be held at the National Chung Cheng University on 30 April 2016.
  7. 2016年03月21日:給想要學習軟體工具甚至是自製軟體工具的同學的建議:OntoCL
  8. 2016年03月20日:預計2016年4月30日假中正大學舉辦研習活動,介紹 TaiwanDH 的新服務。
  9. 2015年09月18日:驚聞元智大學中國語文學系羅鳳珠教授辭世。羅教授長年投入以數位方法與工具來分析與研究文學資料,是一位令人敬佩的先驅。我們為前輩的離去致上無限的哀思:羅鳳珠老師紀念網站
  10. June 10, 2015: We have proven that our tools can handle Korean text as well: context for unigrams & context for collocations. Download the sample and try yourself!
  11. 2015年06月10日:新增韓文示範用文件資料,輸出資料:關鍵詞彙語境檢索關鍵詞組語境檢索
  12. 2015年06月02日:小小讚的YouTube課程 (TaiwanDH on YouTube): thanks to Professor Chu (祝平次) and Mr. Mao (毛元亨)
  13. 2015年05月21日:小小讚的實際應用:國立政治大學賴惠玲教授之「客家象徵符碼〈硬頸〉之演變:臺灣報紙媒體縱剖面之分析」;2015年6月1日14:00-16:00、國立中正大學語言學研究所第231次語言學專題演講 (TWDH in action: an academic research in which TWDH was able to contribute)
  14. 2015年05月13日:新增英文小說 Pride and Prejudice (Jane Austen)-分析簡例
  15. May 13, 2015: Our tools can handle English text too. This is a sample output produced for Pride and Prejudice of Jane Austen.
  16. 2015年05月09日:第六屆數位典藏與數位人文國際研討會 開始徵求論文 : call for papers of the Sixth International Conference on Digital Archives and Digital Humanities
  17. 2015年05月05日:「小小讚」上的分析工具不只是會輸出網頁內容(.html),主要的分析工具也會以 CSV 和 TXT 檔案的形式輸出分析結果這一些分析結果可以讓您再用其他的工具例如 Excel 或者 NodeXL作後續的分析。例如,您使用「關鍵詞彙語境分析」時,擇定以 analysis 作為輸出檔案名稱之後,除了在畫面上看到的 analysis.html 檔案之外,輸出檔案資料夾中不僅會有 analysis.html 也會有 analysis.csv,你可以使用 Excel 進一步處理或者分析 analysis.csv 的內容。「關鍵詞組總頻率統計」所輸出的 TXT 檔案,則是可以再用於 NodeXL 中繪製社會網路 (social networks)。
  18. 2015年04月25日:新增關於 中文斷詞基本資訊 投影片 (可以下載PPT檔案)
  19. 2015年04月22日:新增唐代李白杜甫全唐詩中收錄的著作:李白杜甫。關鍵詞語境分析示例:李杜的月
  20. 2015年04月22日:新增漢代 董仲舒 之春秋繁露》;以《春秋繁露》中的三綱 (君臣、父子、夫婦、夫妻) 為例之共現語境
  21. April 19, 2015: Our tools can process Japanese text. Please check sample outputs for keywords and collocations that were produced for 或阿呆の一生 of 芥川龍之介.
  22. 2015年04月19日:新增日文小說芥川龍之介著作或阿呆の一生》;關鍵詞語境分析一例 與 共現詞組語境一例 
  23. 2015年04月19日:新增歷史類資料《新青年》雜誌第一卷 文字檔案網址
  24. 2015年04月19日:更新版本 (latest version) :修正「關鍵詞彙語境分析」在處理排除名單時的列印問題
  25. 2015年04月12日:如果資料只有一份檔案、而且不需要切割成多份檔案,還是可以使用我們的工具;只是方法比較怪異:建立一個資料夾(假設叫做 "上層資料夾")、在上層資料夾之下再建立一個資料夾 (假設叫做 "子資料夾")、然後把資料檔案放到子資料夾下面。之後就可以用我們的工具分析上層資料夾的內容。(請下載"上層資料夾"資料範例)
  26. April 10, 2015: Latest version: our tools now work for multilingual contents encoded in UTF-8, including Japanese and simplified Chinese; just choose UTF-8 as the encoding for the output files. Such output files will be inaccessible by software configured to handle only BIG5 contents, which is very common in Taiwan, but should remain informative for researchers working on other platforms.
  27. 2015年04月10日:更新版本多語文本分析功能。把輸出檔案的類型設定為UTF-8,則可以分析多國語文,包含日文、簡體中文等可以使用UTF-8作為內碼的資料。不過以此操作之後,因為.csv檔案的內容也將以UTF-8內碼儲存,所以如果Windows上的Excel限定只處理BIG5內碼資料,則可能無法直接處理這一些.csv檔案。儘管如此,新選項之下的輸出資料,仍然可以以文字編輯器來檢視這一些資料,並且結合其他後續分析軟體。
  28. 2015年04月07日:資料檔案的型態必須是文字檔案的".txt"。如果是文字檔案內容,但是檔案型態不是".txt"的話(例如".csv"或者".tsv"),服務軟體仍然會忽略這一些檔案
  29. 2015年04月05日:更新版本:類似四月一日的更新,針對已斷詞資料,可以計算詞彙與詞彙本身的共現次數
  30. 2015年04月01日:更新版本:增強共現詞組的計算功能
  31. 2015年03月24日:更新版本之使用者介面限制「語料資料夾」不可以作為「輸出檔案資料夾」
  32. 2015年03月21日:這一個網站的投影片都放在SlideShare這一個非常國際化的投影片分享平台。透過兩個簡單步驟線上投影片是可以下載的;只是需要請您先建立一個SlideShare的帳號。建立SlideShare的帳號非常簡單,只需要提供您的電子郵件信箱,然後就是選擇自己的帳號、密碼,並不再牽涉其他的個人資料。申請完畢之後,就可以透過自己帳號下載我們所提供的任何線上投影片。SlideShare也提供其他選項,例如您也可以使用您的LinkedIn或者Facebook帳號來下載投影片;因此SlideShare新帳號並非絕對必要。(其他一般問題)
  33. 2015年03月20日:新版線上說明投影片與完整搭配檔案更新版紅樓夢實習投影片
  34. 2015年03月10日:關於為大量的中文文字檔案轉換內碼(包含簡繁互換、內碼轉譯),我們自己是使用一個免費軟體:convertZ。請了解大量資料的轉檔的成效是不容易完美的,在大量資料轉換時,如果有一些小問題,工具軟體不見得會為每一個小問題發出警訊。特別是簡繁中文互換時,convertZ只是轉換內碼,並不進行適當詞彙的替換;例如"電腦"會被換成"电脑而不是 "计算机"。
  35. 2015年03月10日:關於把大量的WORD檔案轉換成文字檔案的工作,我們自己是使用一個免費軟體:Zilla Word to Text Converter。這一個軟體實際上會呼叫 Microsoft Word 來進行轉換,所以您的機器上還是需要有 Microsoft WORD。
  36. 2015年03月09日:關於單ㄧ中文文字檔案內碼的檢測和轉換,我們非常推薦一個免費軟體:notepad++
  37. 2015年03月06日:在三月六日的成大研習活動中,我們遇到數個特殊的狀況,使得我們的程式一時不能執行。這一些問題之後一一得到解決,如果您有類似問題,歡迎參考這一些經驗
  38. 2015年03月06日:中文內碼體驗檔案
  39. 2015年02月28日:新增文本資料三國演義、水滸傳、西遊記、金瓶梅、儒林外史、論語、孟子、荀子、韓非子。您可以使用這一些文本取代紅樓夢實習資料中的紅樓夢,搭配適當的關鍵詞彙檔案,以研究其他文本資料的內容。
  40. 2015年02月28日:紅樓夢實習資料-分析工具紅樓夢文本檔案線上投影片
  41. 2015年02月27日:新增文本資料紅樓夢
  42. 2015年02月27日:分析工具更新版本新加功能:單一檔案分割中文內碼查驗中文檔案轉換內碼服務
  43. 2015年02月15日:(研習公告標記、統計與分析工作坊@中興大學 (線上投影片)
  44. 2015年02月09日:(研習公告標記、統計與分析工作坊@成功大學 (線上投影片)
  45. 2015年02月08日:即將新加功能:中文檔案轉換內碼服務
  46. 2015年02月03日:即將新加功能:單一檔案分割與中文內碼查驗
  47. 2015年01月30日:更新工作坊所提供的軟體工具。請參考更新說明。下載最新版本
  48. 2015年01月27日:計算、圖表與文本分析工作坊@清華大學 (線上投影片)
  49. 2015年01月26日:計算、圖表與文本分析工作坊@台灣大學 (線上投影片)
  50. 2014年12月5-6日:科技部人文及社會科學研究發展司中文學門「從人文到數位人文」跨領域對談學術研習營@政治大學 (臉書上之相關資訊)
  51. 2014年12月1-2日:第五屆數位典藏與數位人文國際研討會@中央研究院
  52. 2014年10月31日:第七屆文學與資訊學術研討會@台北大學