謝舒凱
pic.by DALL-E 3
開始習慣在線上(git)與實體(classroom)的合作方式
到目前為止,我們快要學完 Python 的基礎語法了,接下來我們會學習一些進階的 Python 程式設計概念和技巧,進入資料科學的領域。
這週的主題
文本解析 (text analytics) 是指將文本轉換為結構化的數據,以便進行分析和機器學習,進而挖掘文本中的各種訊息 (text mining) 的一系列技術組合。
text analytics
text mining
例如: (1):要對顧客評論做情緒分析 (2):要對於 email 做 ham/spam 的分類
text manipulation
字符 (character), 字串 (string), 文本 (text) 的關係?
string
s = "Hello, world! It's a beautiful day."
- 字串方法 (string methods) - 字串格式化 (string formatting) - 正則表達式 (regular expression)
說到這裡,我們今天來試試如何用 校園免費版的 datacamp 的課程來加速自學。
合併的講義在 cool 本週課程,請先下載。
打開 datacamp,選擇課程:Regular Expressions in Python
同時開啟新的,或用這個建立副本 colab
# 先建立一個本週課堂的資料夾 > mkdir w7 # 進入資料夾 > cd w7
pip install streamlit # 成功安裝過就跳過 pip install wordcloud
streamlit run app.py
Replit
Q: why double quote