English  |  正體中文  |  简体中文  |  Post-Print筆數 : 27 |  Items with full text/Total items : 110066/141016 (78%)
Visitors : 46385285      Online Users : 973
RC Version 6.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
Scope Tips:
  • please add "double quotation mark" for query phrases to get precise results
  • please goto advance search for comprehansive author search
  • Adv. Search
    HomeLoginUploadHelpAboutAdminister Goto mobile version
    Please use this identifier to cite or link to this item: https://nccur.lib.nccu.edu.tw/handle/140.119/141615


    Title: 網路論壇議論檔案事件主題及其情感傾向分析
    Subject Mining and Sentiment Analysis of Archival Events in the Internet Forum
    Authors: 李育賢
    Lee, Yu-Hsien
    Contributors: 林巧敏
    Lin, Chiao-Min
    李育賢
    Yu-Hsien Lee
    Keywords: 數位人文
    檔案管理
    網路論壇
    文字探勘
    情感分析
    Digital humanities
    Archival management
    Internet forums
    Text mining
    Sentiment analysis
    Date: 2022
    Issue Date: 2022-09-02 14:59:37 (UTC+8)
    Abstract: 大眾的意見經常是公務機關提供服務的參考依據,網路論壇及社群媒體成為了公民發揮「公共性」的場所,因此,本研究欲借助數位人文方法與數位工具,探討網路論壇中有關檔案議題的貼文,在巨觀以及微觀的視角中,對其內容所呈現的主題、情感、脈絡、關聯,加以剖析並探討網路論壇的輿情走勢。
    本研究以想想論壇、風傳媒、關鍵評論網及鳴人堂,四家網路論壇為資料來源,蒐集2012年至2021年之間,共586筆檔案主題貼文。首先透過中研院CKIP Tagger進行文本預處理後,分別使用WEKA、CORPRO、CVAW4.0及Gephi數位工具,依序進行主題分析、語料庫分析、情感分析及社會網絡分析,多面向剖析網路輿情。
    研究結果顯示,網路論壇中常被討論的檔案議題為「檔案解密公開」、「轉型正義與政治檔案」、「歷史研究」、「檔案推廣應用」與「檔案稽憑功能」,其中「檔案解密公開」占比最多;從檔案輿論關鍵字的高共現詞彙可以觀察出,近十年網路中的檔案輿論,與政治事件高度相關;透過情感分析,得知網路論壇檔案文本的情感傾向整體呈現負面,且在主題之間、論壇來源之間呈現差異,加入時間軸可以探得歷史脈絡變化,藉此提供檔案主管機關推動檔案解密公開以及提升檔案應用服務作業之參考。
    Public opinions are often used as a reference by government agencies in order to provide services to citizens. Internet forums and social media platforms have evolved into places where people can exercise their "publicness." In this research, the public opinion patterns in each of the four representative Taiwanese forums are examined together with the themes, sentiments, contexts, and associations presented by the posts on each of the four forums.
    A total of 586 posts from four internet forums were collected for this study between 2012 and 2021. The four internet forums are "Thinking-Taiwan", "The Storm Media", "The News Lens", and "Opinion". As a pre-processing procedure, the study analyzed the posts with CKIP Tagger. After that, digital tools like WEKA, CORPRO, CVAW4.0, and Gephi were used to break down the online public opinions from multiple perspectives. The study then conducted research including topic analysis, corpus analysis, sentiment analysis, and social network analysis.
    The results indicate that "declassification and disclosure of archives," "transformational justice and political archives," "historical research," "archival promotion and application," and "archival audit function" are the four internet forums` most frequently discussed archival topics, with "declassification and disclosure of archives" accounting for the majority of these discussions. Through sentiment analysis, we can see that internet forum texts tend to be read negatively as a whole. However, the topics and forum sources offer varying degrees of the strength of the sentiments. Additionally, by including the timeline, we can help to understand the historical changes. This study hopes to be served as a guide for archival authorities to promote the declassification and disclosure of archives and enhance application services for the archives.
    Reference: 一、中文部份
    丁曉陽、王蘭成(2021)。網路論壇文本特徵詞權重計算優化方法研究。情報理論與實踐,2021(5),187-192。
    王嵐霞、李高峰(2007)。內容分析法在圖書情報領域中的應用與展望。新世紀圖書館,2007(1),16-18。
    王貿(2020)。公務人員關注議題之文字探勘:以PTT公職板為例。大數據與資料科學特刊,45,119-154。
    王毓莉(2007)。網路論壇與國家機器的碰撞:從三個新聞事件看大陸網路論壇對公共性的實踐。新聞學研究,92,37-95。
    王麗蕉(2018)。數位檔案系統在人文研究的應用:以總督府職員錄系統觀察臺灣女力公職發展。圖資與檔案學刊,10(1),44-66。
    江婉琪等(2019)。運用文字探勘分析全民健保與五項總額支付制度之民眾知覺感受。台灣衛誌,38(2),189-202。
    余采蓓、施俊名、郭洪國雄(2019)。運用文字探勘技術探討性相關議題之研究―以PTT論壇 feminine_sex板為例。性學研究,9(2),63-89。
    吳乃德、吳叡人、顏厥安、吳志光(2007)。轉型正義對檔案開放應用影響之報告。檔案局委託研究報告,未出版。
    吳玫(2004)。中文網路論壇的資訊流動。二十一世紀雙月刊,81,113-123。
    李松濤(2020)。數字人文視角下人文研究者利用檔案館藏的行為與激勵研究〔未出版之碩士論文〕。吉林大學管理學院。
    周立柱、賀宇凱、王建勇(2008)。情感分析研究綜述。計算機應用,28(11),2725-2728。
    林巧敏、王立勛(2021)。黨史檔案數位典藏作業及其數位人文工具應用經驗。圖資與檔案學刊,13(1),172-205。
    林昆賢、蔡俊明(2019)。基於深度學習的自然語言處理中預訓練 Word2Vec 模型的研究。國教新知,66(1),15-31。
    林施望(2019)。從「人文計算」到「數字人文」——概念與研究方式的變遷。圖書館論壇,2019(8),12-20。
    林嶔(2021)。詞嵌入模型與其深度學習應用。檢自:https://linchin.ndmctsgh.edu.tw/Deep%20Learning-Theory%20and%20Practice/Lesson%2013/Lesson_13.html#(1)
    邵軒磊(2019)。機器學「習」:以文字探勘法探索習近平時期之大外宣戰略。中國大陸研究,62(4),133-157。
    邵軒磊、曾元顯(2018)。文字探勘技術輔助主題分析--以「中國大陸研究」期刊為例。問題與研究,57,29-62。
    張奕萱(2021)。運用數位人文工具進行網路論壇之檔案主題及情感探勘〔未出版之碩士論文〕。國立政治大學圖書資訊與檔案學研究所。
    郭文平(2020)。語料庫輔助的媒體論述分析:以台灣平面媒體中國夢報導為語料的實證研究。資訊社會研究,38,51-92。
    陳志銘(2021)。類神經網路分類器(課堂講義)。檢自:https://moodle-demo-course.dlll.nccu.edu.tw/course/view.php?id=15
    陳志銘(2021)。社會網絡分析(課堂講義)。檢自:https://moodle-demo-course.dlll.nccu.edu.tw/course/view.php?id=15
    陳育正、孫懋嘉、顧志文與林立偉(2020)。由社群媒體的觀點論習近平主政後對臺統戰策略對我國民眾的影響:以對臺31項措施為例。中國大陸研究,63(2),111-150。
    陳良駒、傅振華、楊誌瑋(2010)。詞彙共現分析在中國大陸信息作戰領域發展之實證研究。中國大陸研究,53(2),111-145。
    陳勇汀(2021)。巨量資料之文字探勘實作。檢自:https://docs.google.com/document/d/e/2PACX-1vTELeEVBh_yOKaQPqgVRc-bM7Tcc3AYJtYl6O7QZR6uwksbHwzLGywvfvvmd0UMn-SbMX4ycbvHpNhq/pub
    陳迪、程朗、王志鋒、熊錦鵬、張玉茹、梨高贊(2021)。論壇情感挖掘研究粽述:現狀、挑戰與趨勢。計算機工程與應用,57(17),17-28。
    陳雅文(1995)。圖書館學與資訊科學大辭典。檢自:https://terms.naer.edu.tw/detail/1683205/
    陶治中、陳亭愷(2016)。社群運算應用於網路輿情情感傾向分析之研究-實施國道計程電子收費政策為例。運輸學刊,28(3),295-334。
    陶治中、簡睿志(2016)。三元決策理論應用於社群媒體挖掘之情感分析-以 UBER 在臺營運話題為例。運輸計劃季刊,45(4),301-330。
    曾元顯(2012)。圖書館學與資訊科學大辭典。檢自:https://terms.naer.edu.tw/detail/1678993/
    程嵐嵐、何丕廉、孫越桓(2005)。基於朴素貝葉斯模型的中文關鍵詞提取算法研究。計算機應用,25(12),2780-2782。
    項潔、涂豐恩(2011)。從保存到創造:開啟數位人文研究,國立臺灣大學出版中心。
    項潔、翁稷安(2012)。數位人文要義:尋找類型與軌跡。國立臺灣大學出版中心。
    項潔、薛弼心(2018)。科技部「數位人文推廣計畫」概述。人文與社會科學簡訊,19(2),86-92。
    黃韋菱(2020)。數位人文系統中之檔案加值應用研究〔未出版之碩士論文〕。國立政治大學圖書資訊與檔案學研究所。
    黃筠芝(2020)。檔案主題新聞之數位人文研究〔未出版之碩士論文〕。國立政治大學圖書資訊與檔案學研究所。
    褚乃慈(2020)。台灣獨立樂團歌詞與樂迷留言內容之情緒分析。〔未出版之博士論文〕。世新大學資訊傳播學系。
    劉嘉薇(2017)。網路統獨的聲量研究:大數據的分析。政治科學論叢,71,113-166。
    闕河嘉、陳光華(2016)。庫博中文獨立語料庫分析工具之開發與應用。數位人文研究與技藝第六輯,285-313。
    黎彥彣(2019)。基於多方面的情感分析模型之共同處理方法〔未出版之碩士論文〕。國立臺灣科技大學電機工程系研究所。
    薛化元、江子陽(2020)。轉型正義的數位人文取徑嘗試:以傅正在自由中國有關黨產議題文章為例。黨產研究,5,175-201。
    薛理桂(2012)揭開檔案的神秘面紗: 後典藏時代的檔案推廣與應用。全國新書資訊月刊,101(5),48-49。
    鄭君、馬曉君、華強(2014)。社會網絡分析工具Ucinet和Gephi的比較研究。情報理論與實踐,37(8),133-138。

    二、西文部份
    Ashok N. Srivastava, Mehran Sahami (2009).Text Mining Classification, Clustering, and Applications.London: Chapman and Hall/CRC.
    Berry, David M.(2012).Understanding Digital Humanities. London: Palgrave MacMillan.
    Blake, C. (2011). Text mining. Annual Review of Information Science and Technology, 45(1), 121-155.
    Dave, Kushal, Lawrence S. and Pennock D. “Mining the Peanut Gallery: Opinion Extraction and Semantic Classification of Product Reviews.” In Proceedings of the 12th International Conference on World Wide Web, WWW 2003, pp. 519-528, 2003.
    Duriau, Reger, & Pfarrer, (2007). A Content Analysis of the Content Analysis Literature in Organization Studies: Research Themes, Data Sources, and Methodological Refinements.Organization Research Methods,10:5–34.Retrieved from https://www.terry.uga.edu/contentanalysis/research-and-methodology.php
    Feldman, R., & Sanger, J. (2007). The text mining handbook: advanced approaches in analyzing unstructured data. Cambridge University Press.
    Grimmer, J., & Stewart, B. (2013). Text as Data: The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts. Political Analysis, 21(3), 267-297. doi:10.1093/pan/mps028
    Hajrizi, R., & Nuçi, K.P. (2020). Aspect-Based Sentiment Analysis in Education Domain. ArXiv, abs/2010.01429. 
    Jin-Cheon Na, Tun Thura Thet, Arie Hans Nasution, Fauzi Munif Hassan(2022). A Sentiment-Based Digital Library of Movie Review Documents Using Fedora.Canadian Journal of Information and Library Science ,35(3):307-337.
    Olga Kolchyna, Tharsis T. P. Souza, Philip Treleaven, Tomaso Aste.Twitter Sentiment Analysis: Lexicon Method, Machine Learning Method and Their Combination.Handbook of Sentiment Analysis in Finance. Mitra, G. and Yu, X. (Eds.)
    Park, Sejung; Bier, Lindsey M.; Park, Han Woo (2021). The effects of infotainment on public reaction to North Korea using hybrid text mining: Content analysis, machine learning-based sentiment analysis, and co-word analysis. Profesional de la información, v. 30, n. 3, e300306.
    Patrik Svensson . Humanities Computing as Digital humanities[EB/OL]. [2018-11-29]. http:// digitalhumanities.org/dhq/vol/3/3/000065/000065.html.
    Rahmad Agus Dwianto, Achmad Nurmandi,& Salahudin Salahudin.The Sentiments Analysis of Donald Trump and Jokowi’s Twitters on Covid-19 Policy Dissemination.Webology, 18(1), 388-405.
    Rosenzweig, R. (2003). Scarcity or Abundance? Preserving the Past in a Digital Era. American Historical Review 108(3), 735-762.Russell, J. A. (1980). A Circumplex Model of Affect. Journal of Personality and Social Psychology, 39(6), 1161–1178. doi: 10.1037/h0077714
    Sultan M. Al-Daihania, Alan Abrahams. Analysis of Academic Libraries` Facebook Posts: Text and Data Analytics. The Journal of Academic Librarianship, 44(2), 1-10.
    Description: 碩士
    國立政治大學
    圖書資訊與檔案學研究所
    109155011
    Source URI: http://thesis.lib.nccu.edu.tw/record/#G0109155011
    Data Type: thesis
    DOI: 10.6814/NCCU202201280
    Appears in Collections:[圖書資訊與檔案學研究所] 學位論文

    Files in This Item:

    File Description SizeFormat
    501101.pdf12137KbAdobe PDF267View/Open


    All items in 政大典藏 are protected by copyright, with all rights reserved.


    社群 sharing

    著作權政策宣告 Copyright Announcement
    1.本網站之數位內容為國立政治大學所收錄之機構典藏,無償提供學術研究與公眾教育等公益性使用,惟仍請適度,合理使用本網站之內容,以尊重著作權人之權益。商業上之利用,則請先取得著作權人之授權。
    The digital content of this website is part of National Chengchi University Institutional Repository. It provides free access to academic research and public education for non-commercial use. Please utilize it in a proper and reasonable manner and respect the rights of copyright owners. For commercial use, please obtain authorization from the copyright owner in advance.

    2.本網站之製作,已盡力防止侵害著作權人之權益,如仍發現本網站之數位內容有侵害著作權人權益情事者,請權利人通知本網站維護人員(nccur@nccu.edu.tw),維護人員將立即採取移除該數位著作等補救措施。
    NCCU Institutional Repository is made to protect the interests of copyright owners. If you believe that any material on the website infringes copyright, please contact our staff(nccur@nccu.edu.tw). We will remove the work from the repository and investigate your claim.
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - Feedback