利用Python進(jìn)行數(shù)據(jù)分析大量實(shí)踐案例教會你如何利用Python庫高效解決各式各樣的數(shù)據(jù)分析問題,本書重點(diǎn)介紹了用于高效解決各種數(shù)據(jù)分析問題的Python語言和庫!独肞ython進(jìn)行數(shù)據(jù)分析》沒有闡述如何利用Python實(shí)現(xiàn)具體的分析方法。
利用Python進(jìn)行數(shù)據(jù)分析目錄
第1章 準(zhǔn)備工作
本書主要內(nèi)容
為什么要使用Python進(jìn)行數(shù)據(jù)分析
重要的Python庫
安裝和設(shè)置
社區(qū)和研討會
使用本書
致謝
第2章 引言
來自bit.ly的1.usa.gov數(shù)據(jù)
MovieLens 1M數(shù)據(jù)集
1880-2010年間全美嬰兒姓名
小結(jié)及展望
第3章 IPython:一種交互式計(jì)算和開發(fā)環(huán)境
IPython基礎(chǔ)
內(nèi)省
使用命令歷史
與操作系統(tǒng)交互
軟件開發(fā)工具
IPython HTML Notebook
利用IPython提高代碼開發(fā)效率的幾點(diǎn)提示
高級IPython功能
致謝
第4章 NumPy基礎(chǔ):數(shù)組和矢量計(jì)算
NumPy的ndarray:一種多維數(shù)組對象
通用函數(shù):快速的元素級數(shù)組函數(shù)
利用數(shù)組進(jìn)行數(shù)據(jù)處理
用于數(shù)組的文件輸入輸出
線性代數(shù)
隨機(jī)數(shù)生成
范例:隨機(jī)漫步
第5章 pandas入門
pandas的數(shù)據(jù)結(jié)構(gòu)介紹
基本功能
匯總和計(jì)算描述統(tǒng)計(jì)
處理缺失數(shù)據(jù)
層次化索引
其他有關(guān)pandas的話題
第6章 數(shù)據(jù)加載、存儲與文件格式
讀寫文本格式的數(shù)據(jù)
二進(jìn)制數(shù)據(jù)格式
使用HTML和Web API
使用數(shù)據(jù)庫
第7章 數(shù)據(jù)規(guī)整化:清理、轉(zhuǎn)換、合并、重塑
合并數(shù)據(jù)集
重塑和軸向旋轉(zhuǎn)
數(shù)據(jù)轉(zhuǎn)換
字符串操作
示例:USDA食品數(shù)據(jù)庫
第8章 繪圖和可視化
matplotlib API入門
pandas中的繪圖函數(shù)
繪制地圖:圖形化顯示海地地震危機(jī)數(shù)據(jù)
Python圖形化工具生態(tài)系統(tǒng)
第9章 數(shù)據(jù)聚合與分組運(yùn)算
GroupBy技術(shù)
數(shù)據(jù)聚合
分組級運(yùn)算和轉(zhuǎn)換
透視表和交叉表
示例:2012聯(lián)邦選舉委員會數(shù)據(jù)庫
第10章 時(shí)間序列
日期和時(shí)間數(shù)據(jù)類型及工具
時(shí)間序列基礎(chǔ)
日期的范圍、頻率以及移動
時(shí)區(qū)處理
時(shí)期及其算術(shù)運(yùn)算
重采樣及頻率轉(zhuǎn)換
時(shí)間序列繪圖
移動窗口函數(shù)
性能和內(nèi)存使用方面的注意事項(xiàng)
第11章 金融和經(jīng)濟(jì)數(shù)據(jù)應(yīng)用
數(shù)據(jù)規(guī)整化方面的話題
分組變換和分析
更多示例應(yīng)用
第12章 NumPy高級應(yīng)用
ndarray對象的內(nèi)部機(jī)理
高級數(shù)組操作
廣播
ufunc高級應(yīng)用
結(jié)構(gòu)化和記錄式數(shù)組
更多有關(guān)排序的話題
NumPy的matrix類
高級數(shù)組輸入輸出
性能建議
附錄A Python語言精要