新聞議題分析 (News Topic Analytics)

中文分詞資料

「活絡 母語 要從 家庭 做起 昨天 是 「 世界母語日 」 , 在 母語 面臨 式微 或 滅絕 的 台灣 , 這個 日子 特別 有意義 。 這一天 , 民間團體 主辦 「母語真心適」 藝文活動 、 「 講母語-俗予你」 商家 消費 優惠 活動 , 高雄市政府 以 影像創作 、 家庭戲劇 比賽 鼓勵 市民 參與 母語 互動 , 而 民進黨主席 蘇貞昌 則 倡言 「 尊重 母語 就是 尊重 不同 族群 的 文化 」 。 這些 關心 台灣 母語 存續 的 機構 與 有識之士 不約而同 , 都 強調 「母語傳承在家庭 」 , 從 親子 說 母語 引領 下一代 對 母語 的 接觸 與 認識 , 為 台灣 與 全人類 保存 母語 。 由 聯合國教科文組織 ( UNESCO ) 所 訂定 的 這 個 國際節日 , 旨在 向 全球 宣傳 保護 語言 資產 的 重要性 , 不但 促進 母語 傳播 及 語言 、 文化多樣性 , 避免 世界 大部分 語言 消失 , 並 積極 鼓勵 觀念 創新 、 擴大 想像 及 意見 交流 , 增進 彼此 瞭解 。 對 台灣 來 說 , 母語 必須 珍惜 , 因為 教科文組織 2001年 已 把 台灣 列為 母語 即將 瀕臨 消失 的 地區 。 根據 國際間 通用 的 標準 , 台灣 的 十幾種 原住民 母語 , 都 屬於 瀕臨滅絕 的 語言 ; 另外 兩種 主要 母語 台語 ( 閩南語) 及 客語 , 也 明顯 式微 或 正 步向 最終 滅絕 的 險境 。 客家庄 出身 的 葉菊蘭 曾 貼切地 形容 這種 母語 危機 ︰ 原住民語 已 住 加護病房 , 客語 在 急診室 , 閩南語 正 掛號 中 。 母語 處境 岌岌可危 , 外來政權 是 罪魁禍首 。 尤其 是 戰後 長期 威權統治 的 中國國民黨 黨國 當局 , 在 語言政策 獨尊 「國語」 , 各族群 語言 、 文字 都 被 打成 「方言」 , 遭到 摧殘 , 在 公共場合 與 媒體 受到 極大限制 , 且 禁絕 於 校園 之中 。 尤有甚者 , 從 日治時代 之前 即已 存在 的 羅馬拼音 台語聖經 及 傳教 活動 , 也 遭 禁止 。 黨國 當局 在 把 許多 台灣菁英 「二二八 」 之後 , 大力 壓制 母語 及 台灣文化 時間 既長 , 手段 也 很 粗暴 , 徹底打壓 絕不手軟 。 以 校園 為例 , 不但 學生 相互 糾察 監視 , 說 母語 被 罰錢 、 處分 、 「掛狗牌」 羞辱 , 成為 許多人 的 痛苦經驗 ; 至於 公家機關 、 交通 等 公共服務 不用 母語 ,尤使 不諳 「國語」 者 到處碰壁 。 手段兇狠 之外 , 母語 加速凋零 , 還 在於 黨國 當局 透過 對 媒體 的 掌控 。 尤其 電視 深入 家庭 之後 , 不論 新聞 、 戲劇 或 綜藝 節目 , 幾近 完全 「 國語化 」 , 甚至 出現 布袋戲 講 「國語」 的 荒誕現象 。 如此 手法 , 既 摧殘 母語 , 兼以 形塑 「 國語人」 高人一等 的 價值觀 , 讓 母語 逐漸 在 社會 生活 中 失去 實用地位 , 也 打造 了 都會 與 北部 不少 「 講國語-蓋高尚」 的 自我感覺良好 一族 。 這種 現象 , 又 因 黨國體制 長期 籠罩 , 隨著 獨尊 「 國語 」 而 疏離 母語 的 一代 為人父母 , 母語 因此 奄奄一息 。 台灣 搶救 母語 工作 , 事實上 是 民主化 的 產物 。 1990 年代 , 李登輝 政府 承認 歧視 母語 的 錯誤 , 母語 且 首見 於 學校 教學 。 民進黨 執政 之後 , 母語教育 在 小學 實施 , 杜正勝 擔任 教育部長 時 規定 , 高中 以下 各校 每週 自訂 一天 為 母語日 。 另一方面 , 黨國體制 班師回朝 之後 , 政策 轉彎 , 母語 教育 重要性 被 刻意 貶低 , 且 表現 於 經費 減少 , 教育 功能 弱化 。 馬英九 政府 寧可 「 兩個 晚上 燒掉 兩億 多元 」 支援 「夢想家」 , 卻 刪減 母語 教育 相關 經費 ; 仍在 存亡絕續 關頭 掙扎 的 母語 , 又 陷 自生自滅 的 危機 。 台灣 是 移民社會 , 台灣文化 包含 南島 、 漢 、 日本 及 西洋 等 要素 , 母語 的 多樣 與 活絡 是 增進 各 族群 之間 瞭解 、 尊重 、 包容 及 欣賞 的 不二法門 。 在 全球化 時代 , 學習 多種語言 是 好事 , 母語 則 是 根本 , 熟練 的 母語 足以 增進 個人 文化 修養 與 人際 互動 。 活絡 母語 不僅 主政者 責無旁貸 , 更須 從 家庭 做起 ; 在家 中 多與 孩子 說 母語 , 母語 由 家庭 扎根 , 台灣文化 才有 發揚光大 的 未來 。」

R 程式列表

library(tm) library(wordcloud) library(RColorBrewer) # ----------------------------------------------------------------------------------------- # 資料目錄 DataBasePath = "/home/richlee/Desktop/TASPAA-2013/Data" # 報紙別 PaperName <- 'LibertyTimes' # 新聞類別 DocCatelog <- 'Culture' # 字詞最低頻次數 DS.MinFreq <- 2 # ----------------------------------------------------------------------------------------- # 設定工作目錄 setwd(paste(DataBasePath, '/', PaperName, '/', DocCatelog, sep = "")) # 讀取資料檔 DS.Source <- scan(paste(DocCatelog, ".txt", sep = ""), what="character", sep="\n", encoding="utf-8", blank.lines.skip=TRUE) # 轉換資料為字詞庫 DS.Data <- VectorSource(DS.Source, encoding="utf-8") DS.Abstract <- Corpus(DS.Data) # 濾字 DS.Abstract <- tm_map(DS.Abstract, removePunctuation) DS.Abstract <- tm_map(DS.Abstract, removeNumbers) DS.Abstract <- tm_map(DS.Abstract, toupper) DS.Abstract <- tm_map(DS.Abstract, removeNumbers) DS.Abstract <- tm_map(DS.Abstract, removeWords, stopwords("english")) # 產生字詞頻率矩陣 DS.Term <- DocumentTermMatrix(DS.Abstract, control=list(removePunctuation=TRUE, stopwords=TRUE, wordLengths=c(2,Inf), bounds=list(global=c(1,Inf)))) # 轉換字詞頻率矩陣為資料框 DS.Matrix <- as.matrix(DS.Term) DS.Sorted <- sort(colSums(DS.Matrix), decreasing=TRUE) DS.WordFreq <- data.frame(word=names(DS.Sorted), freq=DS.Sorted) # 輸出字詞頻率表 A <- subset(DS.WordFreq, select=-c(word)) write.table(A, paste(DocCatelog, '.xlsx', sep='')) print(DS.WordFreq[DS.WordFreq$freq >= DS.MinFreq, ], quote=TRUE) # 產生主題圖色盤 pal <- brewer.pal(9, if(PaperName=='LibertyTimes') "Greens" else "Blues") pal <- pal[-(1:2)] # 產生主題圖 wordcloud(DS.WordFreq$word, DS.WordFreq$freq,scale=c(20,.5), min.freq=DS.MinFreq, max.words=Inf, rot.per=.15, colors=pal) # 輸出主題圖 dev.copy(jpeg, paste(DocCatelog, '.jpg', sep='')) dev.off()