推薦課程:【108-1】吳俊雄「自動網路語料擷取與語料爬梳」

image
(圖取自網路迷因圖庫。Origin from first episode of the second season of Chappelle’s Show. https://vimeo.com/9514207)

「即時語料收集問題需要自動網路語料擷取與語料爬梳手段解決。」

自從電腦化、自動化出現之後,語料庫素材的收集、建立及整理等大量工作都交付電腦執行,待一連串指令設定好後,電腦便能展現其「自動化」的特色擔下原本沉重的工作量。而此過程也不單單是效率的提升,新興的方法還給了研究員更多的想像與創造空間,而解放的勞力心力也能投入到更深、更廣的研究…

吳俊雄老師於108-1所開設課程「自動網路語料擷取與語料爬梳」是一門真正的數位工具課程,使用Python及其模組BeautifulSoup來實現網路爬蟲,利用模組Jieba及RE做斷詞和初步語料爬梳,即時語料庫的獲得將更具效率。

立即點擊了解
自動網路語料擷取與語料爬梳

專任助理 陳信良 筆


教育部數位人文創新人才培育計畫

FB官方粉專

IG官方粉專