陳擎文教學網:客戶關係管理(Customer Relationship Management,CRM)
1.CRM的定義:
是一種企業與【現有客戶及潛在客戶】之間關係互動的管理。通過對客戶資料的歷史積累和分析,CRM可以增進企業與客戶之間的關係,從而最大化【增加企業銷售收入,提高客戶留存率,滿意度,忠誠度】

☎2.CRM在經營管理的位階與定位:
【看商業模式圖(經營模式畫布)】用【視覺化、結構化】方式,一目了然➜快速檢查一家企業的商業模式,在各方面是否已經準備就緒
◉商業模式圖的九構面要素商業模式圖的四大導向Uber的商業模式圖
Uber的需求導向3要素:客群CS,客戶關係CR,客群通路Channel
純喫茶的需求導向3要素:客群CS,客戶關係CR,客群通路Channel
Uber的CRM【市場區隔, Market Segmentation】【選擇目標客戶, Target Customer】都會區白領,商務人士,大學生,特殊需求者
Uber的CRM【差異性行銷】尊榮服務,菁英服務,動態收費
商業模式圖簡介影片

☎3.CRM所收集的客戶數據來源:
CRM會通過多個管道全方面收集客戶的相關資訊,包括:【產銷存系統、問卷調查、電子商務銷售數據、追踪並捕捉客戶在網站或APP的瀏覽行為、公司官網、電話訪談、郵件回覆、線上聊天、Line聊天室、市場行銷活動、銷售人員記錄、社群網路記錄】

※4.分析型CRM:
根據藉由上述各種溝通管道所蒐集到的顧客資料,進而【分析顧客行為】,做【市場區隔, Market Segmentation】【選擇目標客戶, Target Customers】,然後做【差異化行銷, Differentiated Marketing】,作為企業【決策判斷】的依據

☎5.CRM做【市場區隔】與【選擇目標客戶】,並做【差異性行銷】的步驟:
➜(1).【市場調查和分析】:收集市場數據,分析市場需求和競爭情況
➜(2).【選擇目標客戶市場】:根據市場潛力、競爭優勢和企業資源選擇目標市場
➜(3).【制定營銷策略】:針對目標市場制定營銷和銷售策略
➜(4).【實施和監控】:執行營銷策略並持續監控效果

☎6.CRM的【市場區隔, Market Segmentation】最常用的2個方法:
➜(1).【群體細分, Group Segmentation】:根據【人口統計學特徵、購買行為、興趣愛好、地理區隔、行業區隔...】等將客戶分為不同群體,針對性地行銷和服務。
➜(2).【RFM區隔, Recency, Frequency, Monetary】:RFM分析,可識別出高價值客戶、忠誠客戶、即將流失的客戶,並針對不同的客戶群體制定相應的營銷策略和管理計劃
RFM模型RFM應用

7.收集數據的方法:
◉(1).傳統方法:【問卷調查析、訪談】
◉(2).進階方法:【網站流量收集與分析(GA)、追踪客戶網頁/App上的線上瀏覽行為(GTM)】
◉(3).最新方法:【人工智慧自動判別客戶行為後即時動態推薦商品】
◉範例1:問卷調查【男女每週飲料花費】是否有差異?統計分析(平均)結論報告
◉範例2:問卷調查【對於洗面乳選購的在意點】是否男女會有明顯差異?調查數據整理描述統計(平均值)檢定結論報告
◉範例3:【客戶徵信調查】銀行幫客戶打【信用分數】,探討與客戶【總收入,不動產,動產,每月房貸,撫養支出】,信用分數跟哪個參數有關係?統計分析檢定結論報告關係線形圖
◉選擇適當的統計檢定法

8.量化分析數據的方法:
◉(1).傳統方法:使用【SPSS】來做數據的統計分析、
◉(2).進階方法:使用【Python(Scipy)/R程式語言】來做數據的統計分析、
◉(3).最新方法:使用【生成式AI(ChatGPT 4o,Gemini Pro)】來做數據的統計分析

9.CRM的主要手段與目的(成效評估):CRM的「10C」:
◉顧客資料(Customer Profile)、顧客知識(Customer Knowledge)、顧客區隔(Customer Segmentation)、客製化行銷(Customization)
◉顧客滿意度(Customer Satisfaction)、顧客保留率(維繫率,Customer Retention)、顧客贏取率(Customer Acquisition)、顧客獲利率(Customer Profitability)、顧客價值(Customer Value)、顧客的貢獻度發展(Customer Development)

10.電商的成效評估指標:
◉回客率(Back off Rate)、網站轉換率(Conversion Rate,流量轉換率=訂單數/總訪客數)、網站獲利率(Profitability Rate,淨利/成本)
≠>≧=≦< ➜ μ α,➔➜→➡↓↑←⇄⇌⟷⇈⇊⇇⇉⇆,⬅⬆⬇⮕⬈⬉⬊⬋⬌⬍⭠⭡⭢⭣⭤ ⭥ ⮂⮃


資源(Resource)

作業(homework)

chp0.課程簡介

【一,客戶關係管理概述(Customer Relationship Management,CRM)】

chp1.客戶關係管理概述

chp2.客戶關係管理在【經營模式圖】的位階與定位

※商業模式圖影片簡介

chp3.客戶資料管理

chp4.市場區隔與目標客戶選擇

chp5.客戶價值與忠誠度管理➜以胖東來為例

chp6.客戶互動與溝通管理

chp7.數位時代的CRM

chp8.CRM系統選型與實施

chp9.CRM的績效評估與改進

chp10.客戶體驗管理

chp11.CRM的未來趨勢與挑戰

【二,實作:傳統手機客戶數據方法:問卷調查】

在Google雲端硬碟新增目錄:【問卷】,然後新增Goolge表單【調查素食葷食】

22-1-調查素食葷食問卷
※輸入問卷標題後【01調查素食葷食】,再點按檔案名稱
※3個欄位【姓名,性別,便當】,都是必填。【建議事項】不是必填
※必須修改分享設定:【設定】➜「回覆」➜「取消勾選」僅限 XXX帳號及其信任機構中的使用者
※取得測試網址:在【傳送】取得超連結網址
※取得短網址:【傳送】➜縮短網址


22-2-將問卷調查網址轉成QR Code
※如何安裝google chrome的QR Code二維掃碼
➜google chrome的右上角工具➜更多工具➜擴充功能
➜左下角主選單➜開啟chrome線上應用程式商店
➜搜尋:QR Code Generator➜找評分高的精選商品➜安裝:
示意圖1
※先取得網址➜在【傳送】取得超連結網址
※複製連結網址到新網頁,然後右上角點單【擴充功能】➜選擇QR Code Generator➜下載QRCode圖片:
示意圖2示意圖3

22-3-觀看問卷調查的統計數據
※請同學們用手機掃描QR Code後,輸入資料
示意圖3
※瀏覽會員輸入的統計數據:按上方【回覆】,觀看統計數據
示意圖4


22-4-瀏覽每一筆收入數據的細節
※【回覆】➜個別➜上一筆,下一筆
示意圖5

22-5-連結至試算表
※【回覆】➜在試算表中查看
示意圖6示意圖7示意圖8
【檔案】➜【下載成Excel】

新增Goolge 表單【02團購泡菜,只有5箱】

23-1-團購泡菜問卷(修改設定:每題預設都是必填)【成果demo】
23-1-團購泡菜問卷,示意圖

※(1).輸入問卷標題後【02團購泡菜,只有5箱】,再點按檔案名稱
※如何設定欄位預設都是【必填】
➜修改上方【設定】➜預設值➜問題預設設定➜【將問題預設為必填】
示意圖8
※3個欄位【姓名,部門,辣度】,都是必填。
➜【部門】:人資,會計,工程
➜【辣度】:大辣,小辣,不辣
※必須修改分享設定:【設定】➜「回覆」➜「取消勾選」僅限 XXX帳號及其信任機構中的使用者
※取得測試網址:在【傳送】取得超連結網址
※取得短網址:【傳送】➜縮短網址

※(2).如何設定限制數目:【團購泡菜,只有5箱】: ※【注意】Google表單無法設定【截止時間或最多數量】,必須加上【外掛】
➜chrome的右上角第2個[...]工具➜【取得外掛程式】

示意圖1
搜尋:formLimiter➜安裝:
示意圖1
※回到表單【問題】,上方新增一個按鈕【外掛程式】➜formLimiter PORD➜Set Limit➜select➜Number of form response:4➜訂購已經額滿,已經超過5箱➜Save and Enable
示意圖1示意圖2示意圖3示意圖4示意圖5
※【特別注意】:至多訂購5個,則numnber必須為4(若是設定5,則可以最多填入6個)
※設定連結試算表➜【回覆】➜在試算表中查看
※複製網址,在新網頁測試:輸入6筆資料➜第6筆輸入後,無法輸入,且在後台【回覆】➜不接受回應
示意圖6示意圖6
※在試算表查看輸入數據:【回覆】➜在試算表中查看
示意圖7



23-2-在中午11:30前訂購便當【成果demo】
※ 把【前一個表單】複製副本表單,修改問卷標題後【03在中午11:30前訂購便當】,再點按檔案名稱
示意圖1
※回到表單【問題】,上方新增一個按鈕【外掛程式】➜formLimiter PORD➜Set Limit➜select➜Date and Time➜Save and Enable
示意圖1示意圖2
※設定超過時間的訊息:已經超過時間,今天無法再訂購便當了
※測試超過時間,就無法再填寫表單
示意圖3



23-3-如何處理每天的訂購便當表單:建立副本【成果demo】
※(1).【如何每天讓辦公室同仁訂購便當】:
step1:每天把前一天的表單,複製修改成當天的日期:前一天表單➜滑鼠右鍵➜建立副本➜修改名稱:【04每天在中午11:30前訂購便當-20241015】

示意圖3

※【注意】:建立副本後,原本的外掛程式設定都歸零,必須重新設定外掛
※(2).回到表單【問題】,上方新增一個按鈕【外掛程式】➜formLimiter PORD➜Set Limit➜select➜Date and Time➜Save and Enable

示意圖1示意圖2
※設定超過時間的訊息:已經超過時間,今天無法再訂購便當了

※(3).輸入2筆數據
示意圖3

新增Goolge 表單【本次活動滿意度調查(單選)】

24-1-本次活動滿意度調查(單選)【成果demo】
※輸入問卷標題後【05本次活動滿意度調查(單選)】,再點按檔案名稱
※設定欄位預設都是【必填】,且【所有人都可以瀏覽】

※(1).右側menu選【新增標題】:一,滿意度調查
示意圖1

※(2).製作李克特五點量表(數字小的為不滿意,數字大的為滿意):
➜ 新增項目【1.本次活動滿意度】,屬性是【線性刻度】,最左是【非常不滿意】,最右是【非常滿意】

示意圖2示意圖3

※(3).製作單選題(下拉選單):
➜ 新增項目【2.伙食滿意度】,屬性是【下拉選單】,【非常不滿意~非常滿意】

示意圖4示意圖5

※(4).製作單選題(radio圓形選擇按鈕):
➜ 新增項目【3.場地滿意度】,屬性是【選擇題】,【非常不滿意~非常滿意】

示意圖6示意圖7

※(5).製作【4.多題組型單選題】(列是題目,欄是選項):
➜ 適用時機:多題都是5點量表
➜ 新增項目【4.綜合滿意度】,屬性是【單選方格】,【非常不滿意~非常滿意】

➜ 注意:列是題目,欄是選項
示意圖8示意圖9

※(6).右側menu選【新增標題】:二,個人資料
※製作【5.姓名】項目
示意圖10
※製作【6.生日】項目
示意圖11示意圖12



24-2-產品興趣意向調查(複選)【成果demo】
※(1).輸入問卷標題後【06產品興趣意向調查(複選)】,再點按檔案名稱
※設定欄位預設都是【必填】,且【所有人都可以瀏覽】

※(2).右側menu選【新增標題】:一,客戶意向調查

※(3).製作複選題目:
➜ 新增項目【1.對本公司感興趣的產品】,屬性是【核取方塊】
➜ 筆電,桌機,鍵盤,滑鼠,螢幕


※(4).製作【多題組型複選題】(列是題目,欄是選項):
➜ 新增項目【2.品牌喜好傾向調查】,屬性是【核取方塊格】

➜ 注意:列是題目,欄是選項
➜ 筆電,桌機,螢幕
➜ 華碩,宏基,HP,聯想
示意圖1

※(6).右側menu選【新增標題】:二,個人資料調查
※製作【3.姓名】項目
※製作【4.能夠參加本公司活動的日期】項目➜選擇【日期】屬性
※製作【5.能夠參加本公司活動的時間】項目➜選擇【時間】屬性
示意圖2

新增Goolge 表單【是否參加本週日的聚餐?】

25-1-是否參加本週日的聚餐【成果demo】
※輸入問卷標題後【07是否參加本週日的聚餐?】,再點按檔案名稱
※設定欄位預設都是【必填】,且【所有人都可以瀏覽】

※(1).新增2個欄位【姓名,是否參加本週日的聚餐?】,都是必填。
➜【是否參加本週日的聚餐?】:是,否
示意圖1

※(2).如何收集使用者的email?
➜修改上方【設定】➜設定➜【回覆】➜【收集電子郵件地址】➜由作答者手動輸入
示意圖2示意圖3

※(3).如何傳送表單回覆副本給作答者?(user會收到email告知他已經填寫問卷了)
➜修改上方【設定】➜設定➜【回覆】➜【傳送表單回覆副本給作答者】➜一律
示意圖4

※(4).如何才能讓user填寫完後,若要修改問卷的選擇內容?(user打開email即可修改問卷)
➜修改上方【設定】➜設定➜【回覆】➜【允許編輯回覆】➜打開
示意圖5

※(5). 如何設定user填寫完所看到的訊息?
➜修改上方【設定】➜設定➜【簡報】➜【確認訊息】➜編輯➜已經收到答案,謝謝你的填寫
示意圖5, 示意圖6, 示意圖7, 示意圖8, 示意圖9, 示意圖10, 示意圖11

新增Goolge 表單【上傳作業檔案(zip)】

26-1-上傳作業檔案(zip)【成果demo】
※輸入問卷標題後【08上傳作業檔案(zip)】,再點按檔案名稱
※設定欄位預設都是【必填】,且【所有人都可以瀏覽】

※(1).新增1個欄位【姓名】。
※(2).新增1個欄位【上傳作業檔案】(屬性是:檔案上傳)
示意圖1示意圖2示意圖3

※(2).測試表單:上傳一個zip壓縮檔案
示意圖4示意圖5示意圖6

※(3).檢查上傳一個的檔案在你的雲端硬碟的什麼地方
➜到你的雲端硬碟的目錄【問卷】➜要記得要『重新整理Refresh』
➜顯示多出一個新的目錄➜08上傳作業檔案(zip) (File responses)
示意圖7示意圖8

※(4).設定標題圖片
➜修改右上方【自訂主題】➜【頁首】➜選擇圖片

※(5).設定背景顏色
➜修改右上方【自訂主題】➜【頁首】➜背景顏色:勾選顏色
示意圖9
示意圖10
示意圖11
示意圖12

※(6).如何自行設定標題圖片: 到canva網站
➜注意:註冊者後,付費圖片有1個月的免費使用權,其它圖片則都是免費的
左邊選擇【範本】➜上方輸入搜尋關鍵字:【google表單】
➜選擇1個圖片範本➜要選擇免費的範本(沒有皇冠 Pro的圖片)
示意圖13
➜點按【自訂此範本】
示意圖14
➜修改框框內的文字:【微積分課程滿意度調查】
➜修改【置中對齊,字體】
示意圖15
➜下載:按右上角【分享】➜下載
示意圖16
➜設定標題圖片➜修改右上方【自訂主題】➜【頁首】➜選擇圖片➜上傳圖片
➜注意:上傳首頁圖片後,系統會自動設定背景顏色來配色
示意圖17

新增Goolge 表單【區段跳題,選菜色】

27-1-區段跳題,選菜色【成果demo】
※輸入問卷標題後【09區段跳題,選菜色】,再點按檔案名稱
※設定欄位預設都是【必填】,且【所有人都可以瀏覽】

※(1).問卷流程結構:


※(2).新增5個項目【姓名,葷食或素食?,選擇葷食菜色,選擇素食菜色,選擇飲料】。
➜【葷食或素食?】:葷食,素食
➜【選擇葷食菜色】:雞腿便當,豬排便當,魚排便當
➜【選擇素食菜色】:香菇豆腐便當,胡蘿蔔毛豆便當,番茄雞蛋便當
➜【選擇飲料】:紅茶,可樂,咖啡
示意圖1示意圖2

※【區段的處理】
※(3).新增3個項目【區段】:【葷食菜色,素食菜色,飲料】
示意圖3示意圖4

※【設置區段的相關項目】
※(4).拖曵相關項目到相關的【區段】:
➜拖曵【選擇葷食菜色】項目到【葷食菜色】區段
➜拖曵【選擇素食菜色】項目到【素食菜色】區段
➜拖曵【選擇飲料】項目到【飲料】區段
【葷食菜色,素食菜色,飲料】
示意圖5

※(5).【設置『項目』跳題『區段』】
➜到第2個項目【葷食或素食?】,在右下角【...]更多選項:【根據答案前往相關區段】
示意圖6示意圖7示意圖8
➜到第3個項目【選擇葷食菜色】,在右下角【...]更多選項:【根據答案前往相關區段】
示意圖9
➜第4個項目【選擇素食菜色】,不需要設定跳題,因為下一個項目就是【飲料】區段

※(6).測試:
示意圖10示意圖11示意圖12示意圖13

新增Goolge 表單【匯入過去的1個表單來修改】

28-1-匯入過去的1個表單來修改訂購便當【成果demo】
※輸入問卷標題後【10-匯入過去的1個表單來修改訂購便當】,再點按檔案名稱
※設定欄位預設都是【必填】,且【所有人都可以瀏覽】

※(1).問卷流程結構:


※(2).新增2個項目【姓名,是否訂購便當】
示意圖1

※(3).匯入1個過去的表單:【09區段跳題,選菜色】
➜【全選】,但是取消勾選【姓名】
示意圖2示意圖3示意圖4示意圖5

※(4).【設置『項目』跳題『區段』】
➜到第1個項目【是否訂購便當】,在右下角【...]更多選項:【根據答案前往相關區段】
示意圖6

※【注意】:匯入的『跳題』設定,要重新設定
※(5).【設置『項目』跳題『區段』】
➜到第2個項目【葷食或素食?】,在右下角【...]更多選項:【根據答案前往相關區段】
示意圖7示意圖8示意圖9

➜到第3個項目【選擇葷食菜色】,在右下角【...]更多選項:【根據答案前往相關區段】
示意圖10

➜第4個項目【選擇素食菜色】,不需要設定跳題,因為下一個項目就是【飲料】區段

※(6).測試:
示意圖11示意圖12

示意圖13示意圖14示意圖15示意圖16示意圖17示意圖18示意圖19

新增Goolge 表單【測驗卷:2024年全世界人口數調查】

28-2-測驗卷:2024年全世界人口數調查【成果demo】
※輸入問卷標題後【11-測驗卷:2024年全世界人口數調查】,再點按檔案名稱
※設定欄位預設都是【必填】,且【所有人都可以瀏覽】

※(1).將【問卷】改成【測驗卷】
➜上方【設定】➜設定➜勾選【設為測驗】
示意圖1

※(2).新增1個項目【姓名】

※(3).新增第1題【1.全世界人口數是多少?】
➜【61億人,71億人,81億人,91億人】
➜設定答案【81億人】,分數【25】分
示意圖2示意圖3

※(4).新增第2題【2.全世界人口數排名第一的是哪一個國家? 】
➜【中國,美國,印度,巴基斯坦】
➜設定答案【印度】,分數【25】分

※(5).新增第3題【3.中國人口數多少? 】
➜【12.25億人,13.25億人,14.25億人,15.25億人】
➜設定答案【14.25億人】,分數【25】分

※(6).新增第4題【4.印度人口數多少? 】
➜【12.28億人,13.28億人,14.28億人,15.28億人】
➜設定答案【14.28億人】,分數【25】分

※(7).測試:
示意圖4示意圖5
➜答題後可以看成績與解答
示意圖6示意圖7

28-3-自動化出題測驗卷:word表格➜自動轉成Google表單【成果demo】
※(1).此「線上測驗範本」【開發者】:教育機構資安驗證中心、中興大學計算機及資訊網路中心
先到【教學官網】,複製範本檔案到自己的雲端硬碟

※(2).將此「線上測驗範本」Google文件(2021.6.18版本),建立副本到你自己的雲端硬碟
➜【教學網站】:開啟【線上測驗範本】Google文件
➜【建立副本】
示意圖1示意圖2

※(3).將此檔案建立副本到你自己的雲端硬碟:【線上測驗範本-中興大學】
示意圖3示意圖4

※(4).將此檔案【移動】到自己雲端硬碟的【問卷】目錄
示意圖5示意圖6

※(5).開啟【線上測驗範本-中興大學】檔案後,先接受【創用CC授權】
示意圖7

※(6).瀏覽【創用CC授權條款】:允許使用者重製、散布、傳輸以及修改著作(包括商業性利用),惟使用時必須按照著作人或授權人所指定的方式,表彰其姓名。
➜【技術】:結合Google表單與Google Apps Script
示意圖8示意圖9

※(7).產出【Google表單測驗卷】:
➜要產出的Google表單檔名為何:中興大學測驗卷
➜結果:等待2分鐘
示意圖10示意圖11示意圖12

※(8).瀏覽【中興大學測驗卷】:
➜到自己的雲端硬碟目錄【問卷】➜網頁要重新整理Refresh➜打開【中興大學測驗卷】
示意圖13示意圖14示意圖15

28-4-自動化出題測驗卷:計算機概論PDF考題➜word表格➜Google表單【成果demo】
※(1).預先動作如chp28-3所述,已經複製測驗卷範本到自己雲端硬碟的【問卷】目錄
※(2).開啟【線上測驗範本-中興大學】檔案後,【建立副本】
➜檔案名稱:【線上測驗範本-計算機概論考題】
示意圖1示意圖2

※(3).開啟【PDF考題】:計算機概論考題
開啟或下載【PDF考題】

※(4).螢幕截圖:把每1題考題,截圖到【線上測驗範本-計算機概論考題】文件檔案
【Windows截圖指令】:Windows+Shift+S
【Windows複製的剪貼簿空間:Windows+V
【注意】:每一題一定要加上文字,不可以只有圖片
【例如】:如圖所示,請作答:
➜答錯囉,自然語言是人類用來溝通的語言,例如中文、英文、日文等。自然語言不是程式語言
➜答錯囉,C++ 是一種高級程序設計語言,它具有強大的功能,支援物件導向編程
➜答錯囉,在數據庫管理系統中,SQL 主要用於搜索和操縱數據
➜答錯囉,程式編譯是將高階程式語言轉換成機器語言的過程,它是程式設計師的工作,而不是操作系統的工作
➜答錯囉,本地存儲是指在使用者本地的存儲,它不是雲計算的特點
示意圖3

※(5).先接受【創用CC授權】
示意圖4示意圖5

※(6).瀏覽【創用CC授權條款】:允許使用者重製、散布、傳輸以及修改著作(包括商業性利用),惟使用時必須按照著作人或授權人所指定的方式,表彰其姓名。
➜【技術】:結合Google表單與Google Apps Script
示意圖6示意圖7

※(7).產出【Google表單測驗卷】:
➜要產出的Google表單檔名為何:計算機概論考題測驗卷
➜結果:等待2分鐘
示意圖8示意圖9

※(8).瀏覽【計算機概論考題測驗卷】:
➜到自己的雲端硬碟目錄【問卷】➜網頁要重新整理Refresh➜打開【計算機概論考題測驗卷】
示意圖10示意圖11

28-5-測驗卷:2024年全世界人口數調查【成果demo】
※(1).預先動作如chp28-3所述,已經複製測驗卷範本到自己雲端硬碟的【問卷】目錄
※(2).開啟【線上測驗範本-中興大學】檔案後,【建立副本】
➜檔案名稱:【線上測驗範本-世界人口數考題】
示意圖1

※複製:世界人口數考題
※(3).新增第1題【1.全世界人口數是多少?】
➜【61億人,71億人,81億人,91億人】
➜設定答案【81億人】,分數【25】分

※(4).新增第2題【2.全世界人口數排名第一的是哪一個國家? 】
➜【中國,美國,印度,巴基斯坦】
➜設定答案【印度】,分數【25】分

※(5).新增第3題【3.中國人口數多少? 】
➜【12.25億人,13.25億人,14.25億人,15.25億人】
➜設定答案【14.25億人】,分數【25】分

※(6).新增第4題【4.印度人口數多少? 】
➜【12.28億人,13.28億人,14.28億人,15.28億人】
➜設定答案【14.28億人】,分數【25】分

※(6).把每1題題目,複製文字到【線上測驗範本-世界人口數考題】文件檔案
➜答錯囉,答案是81億人
➜答錯囉,印度是全世界人口數第1國家
➜答錯囉,中國人口數14.25億人
➜答錯囉,印度人口數14.28億人
示意圖2

※(7).先接受【創用CC授權】
示意圖3示意圖4

※(8).瀏覽【創用CC授權條款】:允許使用者重製、散布、傳輸以及修改著作(包括商業性利用),惟使用時必須按照著作人或授權人所指定的方式,表彰其姓名。
➜【技術】:結合Google表單與Google Apps Script
示意圖5示意圖6

※(9).產出【Google表單測驗卷】:
➜要產出的Google表單檔名為何:世界人口數考題測驗卷
➜結果:等待2分鐘
示意圖7

※(10).瀏覽【計算機概論考題測驗卷】:
➜到自己的雲端硬碟目錄【問卷】➜網頁要重新整理Refresh➜打開【世界人口數考題測驗卷】
示意圖8

【三,實作:傳統量化分析方法:SPSS】

【3-1,SPSS輸入數據的各種方法】

※(1).30-1-北科大軟體雲網址
➜北科大軟體雲的軟體,都是線上版本,不提供單機安裝
➜有些軟體雲軟體,提供由客戶端軟體VMware來連線
➜有些軟體雲軟體,可以由網頁連線

※(2). 要如何使用北科軟體雲?(2種方法:使用客戶端界面,或使用網頁)
【步驟1】:  
◉【使用客戶端界面】:下載 VMware Horizen Client 並安裝(設定新增伺服器 「vdesk.ntut.edu.tw」)  
◉【使用網頁】:或使用瀏覽器進入 vdesk.ntut.edu.tw
【步驟2】:  
◉登入校園入口網站帳號密碼  
◉選擇要使用的軟體或桌面

※(3).軟體雲使用須知:
◉若需使用應用程式存取本機檔案,請下載客戶端。
◉為避免使用者長期占用,工作階段每240分鐘中斷乙次。
◉工作階段中斷後有寬限期20分鐘,再次連線即可恢復。
◉工作階段中斷後20分鐘後桌面及應用程式將主動還原。

※(4).用【網頁方式】使用Spss:
示意圖1示意圖2示意圖3示意圖4示意圖5

※(5).用【安裝客戶端界面VMware Horizen Client】使用Spss:
示意圖1下載軟體示意圖2安裝後開啟,新增伺服器示意圖3伺服器vdesk.ntut.edu.tw示意圖4選擇IBM Spss 23示意圖5開啟Spss示意圖5

※(1).下載或開啟【夏令營青少年的個資pdf檔案】

※(2). 把數據用Gemini/ChatGPT 4o來辨識,並取得表格資料,然後輸入到SPSS
※(3). 登入北科大軟體雲的SPSS軟體畫面
※(4). 設定欄位的屬性(設定變數)
◉點按【變數視圖】
示意圖1示意圖2
◉設定變數名稱:
➜【編號】:數值,8位寬度,0位小數點
➜【姓名】:字串,8位寬度,0位小數點
➜【性別】:字串,8位寬度,0位小數點
➜【年齡】:數值,8位寬度,0位小數點
➜【身高】:數值,12位寬度,1位小數點
➜【體重】:數值,12位寬度,1位小數點

※(5). 輸入資料(複製貼上)
➜切換到【資料視圖】視窗
➜從excel工作表複製數據到視窗內
示意圖3 但是姓名只有顯示2個字,示意圖

※(6). 如何顯示3個字的姓名:
特別注意:【中文姓名】: 若要顯示3個中文字,建議將欄位寬度設定為9-12之間
換言之:1個中文字,寬度為3-4之間
➜【姓名】:字串,12位寬度,0位小數點
設定姓名為12寬度,示意圖正常顯示3個字的姓名,示意圖

※(7). 簡單的統計分析:【描述性統計分析】
➜上方menu➜【分析】➜【描述統計】➜【描述統計】
➜選擇要分析的變數➜【身高】
描述統計,示意圖設定要統計分析的變數(身高),示意圖


※(8). 儲存成SPSS格式檔案【*.sav】
➜上方menu➜【檔案】➜【另存新檔】➜31-1
另存新檔,示意圖檔案名稱31-1,示意圖
➜【錯誤的儲存位置】預設儲存目錄:C:user/帳號/Documents
錯誤存檔位置,示意圖
➜【正確的儲存位置】:F:\NTUT-Cloud
➜【注意】計網中心提供5GB空間,存放空間為NTUT-Cloud(F:\)磁碟機。
正確存檔位置,示意圖

※(9). 儲存成Excel格式檔案【*.xlsx】
➜上方menu➜【檔案】➜【另存新檔】➜31-1.xlsx
另存Excel檔案,示意圖
【注意】儲存的Excel檔案只會有數據,不會有欄位定義的設定

※(10). 如何將計網中心存放空間的sav檔案,下載到自己的筆電硬碟
【原理】➜先登入計網中心的個人window作業系統➜用網頁登入北科大的電子郵件信箱➜寄信給自己,附加檔案(31-1.sav)即可。
用網頁方式登入北科大軟體雲  
◉【使用網頁】:使用瀏覽器進入 vdesk.ntut.edu.tw
選擇網頁版,示意圖1
選擇Windows CHT,示意圖2
自己在北科大軟體雲的Windows作業系統空間,示意圖3
開啟網頁登入自己的email,示意圖4
寄信給自己,附件檔案為F:\31-1.cav,示意圖5

※(1).下載或開啟【夏令營青少年的個資Excel檔案】

※(2). 注意:在軟體雲的SPSS軟體,無法直接讀入你筆電的excel檔案(02-夏令營.xlsx)
➜【解決辦法】:要先把excel檔案(02-夏令營.xlsx),上傳到北科大軟體雲的windows作業系統(F:\)硬碟空間
➜【例如,方法1】:用學校的email寄信到給自己,附加excel檔案(02-夏令營.xlsx)
➜【注意】:軟體雲的Windows空間,登入Gmail時手機驗證碼無法傳送到手機,所以無法登入Google雲端硬碟
excel上傳到F:\硬碟,示意圖1

※(3). 登入北科大軟體雲的SPSS軟體畫面,開啟SPSS軟體
➜上方menu➜【檔案】➜【開啟】➜【資料】
開啟資料檔,示意圖1格式選xlsx,示意圖2示意圖3讀入後顯示數據資料,示意圖4
【注意】:讀入excel檔案,SPSS會自動判別欄位變數的屬性(數值,字串,日期...)
讀入後顯示變數,示意圖5

※(4). 簡單的統計分析:【描述性統計分析】
➜上方menu➜【分析】➜【描述統計】➜【描述統計】
➜選擇要分析的變數➜【身高】
描述統計,示意圖設定要統計分析的變數(身高),示意圖描述統計分析結果,示意圖

※(5). 儲存成SPSS格式檔案【*.sav】
➜上方menu➜【檔案】➜【另存新檔】➜31-1
另存新檔,示意圖檔案名稱31-1,示意圖
➜【錯誤的儲存位置】預設儲存目錄:C:user/帳號/Documents
錯誤存檔位置,示意圖
➜【正確的儲存位置】:F:\NTUT-Cloud
➜【注意】計網中心提供5GB空間,存放空間為NTUT-Cloud(F:\)磁碟機。
正確存檔位置,示意圖

※(1).下載或開啟【夏令營青少年的個資CSV檔案】

※(2). 注意:在軟體雲的SPSS軟體,無法直接讀入你筆電的csvl檔案(02-夏令營.xlsx)
➜【解決辦法】:要先把csvl檔案(02-夏令營.csv),上傳到北科大軟體雲的windows作業系統(F:\)硬碟空間
➜【例如,方法1】:用學校的email寄信到給自己,附加csvl檔案(02-夏令營.xlsx)
csvl上傳到F:\硬碟,示意圖1

※(3). 登入北科大軟體雲的SPSS軟體畫面,開啟SPSS軟體
➜上方menu➜【檔案】➜【開啟】➜【資料】
➜【錯誤做法】➜資料格式選擇:*.txt, *.csv....
不能選【txt,csv】格式,示意圖1
➜【正確做法】➜資料格式選擇:*.*
要選【*.*】格式,示意圖1示意圖2
➜勾選【變數名稱在檔案的頂端】
變數名稱在檔案的頂端,示意圖1示意圖3示意圖4示意圖5
【注意】:讀入csv檔案,SPSS會自動判別欄位變數的屬性(數值,字串,日期...)
讀入後顯示變數,示意圖5
讀入後顯示數據資料,示意圖5

31-4-身高體重調查【成果demo】
※(1).建立Google表單,輸入問卷標題後【31-4-身高體重調查】,再點按檔案名稱
※設定欄位預設都是【必填】,且【所有人都可以瀏覽】
Google表單,示意圖1
※(2).輸入最少10筆數據資料
※(3).取得【Google試算表記錄】
➜上方【回覆】➜【連結到試算表】

※(4).將【Google試算表記錄】➜轉成Excel檔案
➜【檔案】➜【下載】➜Excel➜31-4-身高體重.excel
試算表轉成Excel,示意圖1

※(5).【軟體雲SPSS】➜讀入Excel➜發生當機
SPSS讀入Excel檔案時出現錯誤,而且當機,示意圖1
➜【軟體雲主機當機的處理方法】➜回到VMware虛擬客戶端平台,
離線伺服器,示意圖1登出,示意圖1再連線,示意圖1
➜再連線後,等待5秒連線➜點選【工作管理員】➜關閉【SPSS軟體】
選工作管理員,示意圖1
➜發生錯誤的原因:Google表單試算表的第1個欄位是【時間戳記】:7/27/2024 13:55:23
➜ Excel中的【時間戳記錄格式】,與SPSS的日期格式不一致,導致無法正確識別
➜ Excel中的【日期時間格式】:7/27/2024 13:55:23
➜ SPSS中的【日期時間格式】:2024/7/27 13:55:23
➜ 【差異點】:年的位置不同:Excel為MM/DD/YYYY,SPSS為YYYY/MM/DD

※(6).【解決辦法】:在Excel中調整格式:
➜將時間戳記轉換為日期時間格式: 在Excel中,選中時間戳記所在的列,然後點擊「數字」格式,選擇適合的日期時間格式(例如,"YYYY/MM/DD HH:MM:SS")。
打開Excel檔案,選時間戳記欄位,示意圖1
YY/MM/DD HH:mm格式,選時間戳記欄位,示意圖1
結果,選時間戳記欄位,示意圖1
➜【另存新檔】31-4-身高體重調查-YYMMDD.xlsx
➜用email附加檔案,寄信給自己
➜登入北科大軟體雲的windows作業系統,用email附加檔案,寄信給自己,下載excel檔案到F:\硬碟
➜登入北科大軟體雲的SPSS➜【檔案】➜【開啟】➜【資料】31-4-身高體重調查-YYMMDD.xlsx
在軟體雲SPSS讀入google表單的數據,選時間戳記欄位,示意圖1

※(7).【結論1】:若是Google表單➜Google試算表➜Excel➜SPSS,一定會發生錯誤與當機,因為Excel與SPSS的日期格式不一樣
【結論2】:要把Google表單產生試算表的日期改成➜【YY/MM/DD HH:mm】格式

【3-2,SPSS繪製圖表的各種方法】

※(1).【成果Demo】:3D長條圖成果,示意圖:

陰影長條圖成果,示意圖
平面長條圖成果,示意圖

※(2).下載問卷調查資料:教師幸福感指數調查
※上傳【32-1-教師幸福感問卷調查_1.xlsx】,到北科大軟體雲的windows電腦的F:\硬碟
※【問卷調查題目】:國小教師職場生活感受調查
........
※【性別】:1男,2女
※【擔任職務】:1x科任未兼任行政,2x教師兼組長,3x級任未兼任行政,4教師兼主任
※【服務地區】:1北區,2中區,3南區,4東區
※【服務年資】:1:5年以下,2:6-10年,3:11-15年,4:16-20年,5:21-25年,6:26年以上
........
※貳:教師職場靈性量表:
※A1-【我覺得自己是學校的一份子】:5非常符合,4大部分符合,3一半符合,2少部分符合,1非常不符合
........
........
※叁:教師幸福感量表:
※B1-【回想我的工作生涯,我滿意自己的工作表現】:5非常符合,4大部分符合,3一半符合,2少部分符合,1非常不符合
........
........

※(3).用北科大軟體雲的SPSS讀入【32-1-教師幸福感問卷調查_1.xlsx】檔案
讀入問卷檔案,示意圖1

※(4).【繪圖長條圖】:服務年資的頻數分析分佈圖
➜上方【分析】➜【敘述統計】➜【次數分配表】
次數分配表,示意圖1選擇服務年資-圖表,示意圖1服務年資柱狀圖,示意圖1

※(5).【在長條圖上,加註『數字,百分比』】:
➜快速點按2下【長條圖】,才能編輯圖表➜開啟【圖表編輯器】
圖表編輯器,示意圖1
➜點按任何一條【柱狀圖】➜滑鼠右鍵➜【顯示資料標籤】
選擇『顯示資料標籤』,示意圖
加上2個參數『計數,百分比』,示意圖
顯示『計數,百分比』柱狀圖,示意圖

※(6).【顯示3D長條圖,或是陰影長條圖】:
➜在【圖表編輯器】➜點按任何一條【柱狀圖】➜滑鼠右鍵➜【內容視窗】
長條圖右鍵的內容視窗,示意圖1
➜選擇【深度與角度】➜勾選【3D】➜套用
勾選3D長條圖,示意圖
3D長條圖成果,示意圖

➜選擇【深度與角度】➜勾選【陰影】➜套用
陰影長條圖成果,示意圖

※(7).【如何把x軸的5點量表(1~5)數字,轉成代表意義的文字】:
➜【服務年資】:1:5年以下,2:6-10年,3:11-15年,4:16-20年,5:21-25年,6:26年以上
➜在【圖表編輯器】➜點按任何一條【柱狀圖】➜滑鼠右鍵➜【內容視窗】➜【種類】
長條圖的種類,示意圖
➜回到資料工作表區,在【變數視圖】➜點按【服務年資】這一列➜點按【值】這一欄
➜【值】➜1
➜【標籤】➜5年以下
➜【新增】
......
➜新增全部的【服務年資】:1:5年以下,2:6-10年,3:11-15年,4:16-20年,5:21-25年,6:26年以上
服務年資類的【值】欄新增標籤,示意圖
全部的【值:標籤】,示意圖
➜重新繪圖
平面長條圖,示意圖
3D長條圖,示意圖
陰影長條圖,示意圖

※(1).【成果Demo】:繪製【服務年資】的長條圖:

陰影長條圖成果,示意圖
平面長條圖成果,示意圖

※(2).下載問卷調查資料:教師幸福感指數調查
※上傳【32-1-教師幸福感問卷調查_1.xlsx】,到北科大軟體雲的windows電腦的F:\硬碟
※【問卷調查題目】:國小教師職場生活感受調查
........
※【性別】:1男,2女
※【擔任職務】:1x科任未兼任行政,2x教師兼組長,3x級任未兼任行政,4教師兼主任
※【服務地區】:1北區,2中區,3南區,4東區
※【服務年資】:1:5年以下,2:6-10年,3:11-15年,4:16-20年,5:21-25年,6:26年以上
........
※貳:教師職場靈性量表:
※A1-【我覺得自己是學校的一份子】:5非常符合,4大部分符合,3一半符合,2少部分符合,1非常不符合
........
........
※叁:教師幸福感量表:
※B1-【回想我的工作生涯,我滿意自己的工作表現】:5非常符合,4大部分符合,3一半符合,2少部分符合,1非常不符合
........
........

※(3).用北科大軟體雲的SPSS讀入【32-1-教師幸福感問卷調查_1.xlsx】檔案
讀入問卷檔案,示意圖1

※(4).【繪圖長條圖】:服務年資的頻數分析分佈圖
➜上方【分析】➜【敘述統計】➜【次數分配表】
次數分配表,示意圖1選擇服務年資-圖表,示意圖1服務年資柱狀圖,示意圖1

※(5).【在長條圖上,加註『數字,百分比』】:
➜快速點按2下【長條圖】,才能編輯圖表➜開啟【圖表編輯器】
圖表編輯器,示意圖1
➜點按任何一條【柱狀圖】➜滑鼠右鍵➜【顯示資料標籤】
選擇『顯示資料標籤』,示意圖
加上2個參數『計數,百分比』,示意圖
顯示『計數,百分比』柱狀圖,示意圖

※(6).【顯示3D長條圖,或是陰影長條圖】:
➜在【圖表編輯器】➜點按任何一條【柱狀圖】➜滑鼠右鍵➜【內容視窗】
長條圖右鍵的內容視窗,示意圖1
➜選擇【深度與角度】➜勾選【3D】➜套用
勾選3D長條圖,示意圖
3D長條圖成果,示意圖

➜選擇【深度與角度】➜勾選【陰影】➜套用
陰影長條圖成果,示意圖

※(7).【如何把x軸的5點量表(1~5)數字,轉成代表意義的文字】:
➜【服務年資】:1:5年以下,2:6-10年,3:11-15年,4:16-20年,5:21-25年,6:26年以上
➜在【圖表編輯器】➜點按任何一條【柱狀圖】➜滑鼠右鍵➜【內容視窗】➜【種類】
長條圖的種類,示意圖
➜回到資料工作表區,在【變數視圖】➜點按【服務年資】這一列➜點按【值】這一欄
➜【值】➜1
➜【標籤】➜5年以下
➜【新增】
......
➜新增全部的【服務年資】:1:5年以下,2:6-10年,3:11-15年,4:16-20年,5:21-25年,6:26年以上
服務年資類的【值】欄新增標籤,示意圖
全部的【值:標籤】,示意圖
➜重新繪圖
平面長條圖,示意圖
3D長條圖,示意圖
陰影長條圖,示意圖

※(1).【成果Demo】:繪製【擔任職務】的陰影圓餅圖:

平面餅狀圖成果,示意圖
3D餅狀圖成果,示意圖

※(2).下載問卷調查資料:教師幸福感指數調查
※上傳【32-1-教師幸福感問卷調查_1.xlsx】,到北科大軟體雲的windows電腦的F:\硬碟
※【問卷調查題目】:國小教師職場生活感受調查
........
※【性別】:1男,2女
※【擔任職務】:1x科任未兼任行政,2x教師兼組長,3x級任未兼任行政,4教師兼主任
※【服務地區】:1北區,2中區,3南區,4東區
※【服務年資】:1:5年以下,2:6-10年,3:11-15年,4:16-20年,5:21-25年,6:26年以上

※(3).用北科大軟體雲的SPSS讀入【32-1-教師幸福感問卷調查_1.xlsx】檔案
讀入問卷檔案,示意圖1

※(4).【如何把x軸的5點量表(1~5)數字,轉成代表意義的文字】:
※【擔任職務】:1(科任),2(組長),3(級任),4(主任)
➜回到資料工作表區,在【變數視圖】➜點按【擔任職務】這一列➜點按【值】這一欄
➜【值】➜1
➜【標籤】➜科任
➜【新增】
......
擔任職務全部的【值:標籤】,示意圖

※(5).【繪圓餅圖】:擔任職務的頻數分析分佈圖
➜上方【分析】➜【敘述統計】➜【次數分配表】➜圖表:餅狀圖
設定餅狀圖,示意圖1結果餅狀圖,示意圖1

※(6).【在餅狀圖上,加註『數字,百分比』】:
➜快速點按2下【餅狀圖】,才能編輯圖表➜開啟【圖表編輯器】
➜點按任何一條【柱狀圖】➜滑鼠右鍵➜【顯示資料標籤】
選擇『顯示資料標籤』,示意圖
顯示『計數,百分比』柱狀圖,示意圖

※(7).【顯示3D餅狀圖,或是陰影餅狀圖】:
➜在【圖表編輯器】➜點按任何一條【圓餅】➜滑鼠右鍵➜【內容視窗】
餅狀圖右鍵的內容視窗,示意圖1
➜選擇【深度與角度】➜勾選【3D】➜套用
勾選3D餅狀圖,示意圖
3D餅狀圖成果,示意圖

➜選擇【深度與角度】➜勾選【陰影】➜套用
陰影餅狀圖成果,示意圖

※(1).【成果Demo】:繪製【性別 vs 整體幸福感】的陰影盒形圖:

【盒形圖透露訊息1】:中間黃色箱子:是數據中間50%的數據分佈區域
【盒形圖透露訊息2】:上下長鬚鬚之間:是中間99.3%的數據分佈區域
【盒形圖透露訊息3】:黃色箱子中央黑色粗線:是中位數

※(2).【觀念】:常用的3種畫圖方式
第1種【單一變數的頻數分佈圖】:次數分配表(都是探討單一變數)
第2種【2個變數之間的關聯圖】:【圖形】➜【舊式對話框】(都是探討多變數的繪圖)➜設定(種類軸,變數)
第3種【單一變數的頻數分佈圖】:【圖形】➜【舊式對話框】➜設定【類別軸】

※(3).下載問卷調查資料:教師幸福感指數調查
※上傳【32-1-教師幸福感問卷調查_1.xlsx】,到北科大軟體雲的windows電腦的F:\硬碟
※【問卷調查題目】:國小教師職場生活感受調查
........
※【性別】:1男,2女
※【性別】:1x科任未兼任行政,2x教師兼組長,3x級任未兼任行政,4教師兼主任
※【服務地區】:1北區,2中區,3南區,4東區
※【服務年資】:1:5年以下,2:6-10年,3:11-15年,4:16-20年,5:21-25年,6:26年以上
........
※【整體幸福感】::5非常符合,4大部分符合,3一半符合,2少部分符合,1非常不符合

※(4).用北科大軟體雲的SPSS讀入【32-1-教師幸福感問卷調查_1.xlsx】檔案
讀入問卷檔案,示意圖1

※(5).【如何把x軸的5點量表(1~5)數字,轉成代表意義的文字】:
※【性別】:1男,2女
➜回到資料工作表區,在【變數視圖】➜點按【性別】這一列➜點按【值】這一欄
➜【值】➜1
➜【標籤】➜男
➜【新增】
......
性別全部的【值:標籤】,示意圖

※(6).【繪盒形圖】:『性別 vs 整體幸福感』的統計分佈圖
➜上方【圖形】➜【舊式對話框】(都是探討多變數的繪圖)➜圖表:盒形圖
指定盒形圖,示意圖觀察值群組摘要,示意圖
➜設定【觀察值群組摘要】
【變數】➜【整體幸福感】(y軸,探討的變數)
【種類軸】➜【性別】(x軸,是類別資料)
指定(x,y)➜(種類軸,變數),示意圖
『性別 vs 整體幸福感』的盒形分佈圖

※(7).解釋【盒形圖的四分位距】:

➜1.盒鬚圖(Box Plot):也稱為盒狀圖、箱型圖或箱形圖,是一種統計圖表,用於顯示一組資料的分佈和統計特徵
➜2.箱子(Box):盒鬚圖箱子的上邊框表示Q3,下邊框表示Q1。箱子內部的長度代表資料的中間50%範圍,也稱為四分位距(IQR,Interquartile Range)。
➜3.中位數(Median):盒鬚圖中的中線代表資料的中位數,即將資料按大小排列後的中間值。
➜4.四分位數(Quartiles):盒鬚圖分為四個部分,每個部分代表一個四分位數。第一個四分位數(Q1)是資料的25%分位數,第二個四分位數(Q2)是中位數,第三個四分位數(Q3)是75%分位數。
➜5.異常值(Outliers):盒鬚圖中的資料點,超出了鬚的範圍,通常被視為異常值。


※(8).盒狀圖使用時機
➜1.【比較不同資料集的分佈】:盒鬚圖可以用來比較多個資料集的分佈,以快速識別它們的差異。使用者可以在同一圖表上顯示多個箱子,這樣就能一目瞭然地看出資料集的相對分佈。
➜2.【檢查離羣值】:盒鬚圖特別適用於檢查離羣值或異常值。透過觀察鬍鬚之外的個別點,您可以快速識別那些數值明顯偏差標準的資料點。
➜3.【顯示中位數和四分位數】:盒鬚圖有助於直覺理解資料的中心趨勢和分佈。中位數、第一四分位數和第三四分位數提供了有關資料集的關鍵統計資訊。
➜4.【觀察資料的分散程度】:盒鬚圖的箱子的高度代表了資料的四分位距(IQR),可用於評估資料的變異性。較高的箱子表示資料的分散程度較大。
➜5.【識別偏斜】:透過觀察箱子的不同部分之間的間距,可以識別資料是否存在偏斜。不同間距可能表示資料的偏斜程度。

※(1).【成果Demo】:繪製【服務地區】的頻數分析線形圖,共有3種方法都可以做出:




※(2).【觀念】:常用的3種畫圖方式
第1種【單一變數的頻數分佈圖】:次數分配表(都是探討單一變數)
第2種【2個變數之間的關聯圖】:【圖形】➜【舊式對話框】(都是探討多變數的繪圖)➜設定(種類軸,變數)
第3種【單一變數的頻數分佈圖】:【圖形】➜【舊式對話框】➜設定【類別軸】

※(3).下載問卷調查資料:教師幸福感指數調查
※上傳【32-1-教師幸福感問卷調查_1.xlsx】,到北科大軟體雲的windows電腦的F:\硬碟
※【問卷調查題目】:國小教師職場生活感受調查
........
※【服務地區】:1男,2女
※【服務地區】:1x科任未兼任行政,2x教師兼組長,3x級任未兼任行政,4教師兼主任
※【服務地區】:1北區,2中區,3南區,4東區
※【服務年資】:1:5年以下,2:6-10年,3:11-15年,4:16-20年,5:21-25年,6:26年以上

※(4).用北科大軟體雲的SPSS讀入【32-1-教師幸福感問卷調查_1.xlsx】檔案
讀入問卷檔案,示意圖1

※(5).【如何把x軸的5點量表(1~5)數字,轉成代表意義的文字】:
※【服務地區】:1北區,2中區,3南區,4東區
➜回到資料工作表區,在【變數視圖】➜點按【服務地區】這一列➜點按【值】這一欄
➜【值】➜1
➜【標籤】➜北區
➜【新增】
......
服務地區全部的【值:標籤】,示意圖

※(6).【繪線形圖】:『服務地區』的統計分佈圖
➜上方【圖形】➜【舊式對話框➜圖表:線形圖
指定線形圖,示意圖觀察值群組摘要,示意圖
➜設定【觀察值群組摘要】
【種類軸】➜【服務地區】(單一變數的頻數分析,是類別資料)
設定『服務地區』的線形圖
成果『服務地區』的線形圖

※(7).如何顯示【資料標籤◉,並標註數字】:
➜快速點按2下【線形圖】,才能編輯圖表➜開啟【圖表編輯器】
➜點按任何一條【線形圖】➜滑鼠右鍵➜【新增標記】
新增標記,示意圖

※(8).如何在【資料標籤◉】上【標註數字】:
➜點按任何一條【線形圖】➜滑鼠右鍵➜【新增標記】
選擇『顯示資料標籤』,示意圖
設定『顯示數字標記,顯示數字』,示意圖
成果『顯示數字標記,顯示數字』,示意圖

※(9).如何加上【網格線】:
➜點按圖形空白處➜滑鼠右鍵➜【顯示格線】
『顯示網格,數字標記,顯示數字』,示意圖
設定【線條】【樣式】為虛線,示意圖
成果『顯示網格,數字標記,顯示數字』,示意圖

※(10).方法2:繪製【服務地區】的頻數分析【長條圖】:
➜上方【分析】➜【敘述統計】➜【次數分配表】➜【圖表】選擇【長條圖】
➜增加註記【計數,百分比】
➜修改顯示為【3D】
【服務地區】的頻數分析【長條圖】

※(11).方法3:繪製【服務地區】的頻數分析【長條圖】:
➜上方【圖形】➜【舊式對話框➜圖表:長條圖
指定長條圖,示意圖觀察值群組摘要,示意圖
➜設定【觀察值群組摘要】
【種類軸】➜【服務地區】(單一變數的頻數分析,是類別資料)
設定『服務地區』的長條圖
成果『服務地區』的長條圖

※(1).【成果Demo】:繪製【服務地區 vs 主題幸福感】的對應線形圖:


※(2).【觀念】:常用的3種畫圖方式
第1種【單一變數的頻數分佈圖】:次數分配表(都是探討單一變數)
第2種【2個變數之間的關聯圖】:【圖形】➜【舊式對話框】(都是探討多變數的繪圖)➜設定(種類軸,變數)
第3種【單一變數的頻數分佈圖】:【圖形】➜【舊式對話框】➜設定【類別軸】

※(3).下載問卷調查資料:教師幸福感指數調查
※上傳【32-1-教師幸福感問卷調查_1.xlsx】,到北科大軟體雲的windows電腦的F:\硬碟
※【問卷調查題目】:國小教師職場生活感受調查
........
※【服務地區】:1男,2女
※【服務地區】:1x科任未兼任行政,2x教師兼組長,3x級任未兼任行政,4教師兼主任
※【服務地區】:1北區,2中區,3南區,4東區
※【服務年資】:1:5年以下,2:6-10年,3:11-15年,4:16-20年,5:21-25年,6:26年以上

※(4).用北科大軟體雲的SPSS讀入【32-1-教師幸福感問卷調查_1.xlsx】檔案
讀入問卷檔案,示意圖1

※(5).【如何把x軸的5點量表(1~5)數字,轉成代表意義的文字】:
※【服務地區】:1北區,2中區,3南區,4東區
➜回到資料工作表區,在【變數視圖】➜點按【服務地區】這一列➜點按【值】這一欄
➜【值】➜1
➜【標籤】➜北區
➜【新增】
......

※(6).【繪線形圖】:『服務地區 vs 主題幸福感』的統計分佈圖
➜上方【圖形】➜【舊式對話框➜圖表:線形圖
指定線形圖,示意圖觀察值群組摘要,示意圖
➜設定【觀察值群組摘要】
【種類軸】➜【服務地區】(單一變數的頻數分析,是類別資料)
勾選【其它統計量】➜變數:【整體幸福感】
設定【其它統計量,種類軸】參數
成果『服務地區 vs 主題幸福感』的線形圖

※(7).顯示【資料標籤◉,並標註數字】:
※(8).顯示【資料標籤◉】上【標註數字】:
※(9).顯示【網格線】:
成果『服務地區 vs 主題幸福感』的線形圖

※(1).【成果Demo】:繪製【性別,擔任職務】的綜合頻數分析,用【3D長條圖】表示:


※(2).【觀念】:常用的3種畫圖方式
第1種【單一變數的頻數分佈圖】:次數分配表(都是探討單一變數)
第2種【2個變數之間的關聯圖】:【圖形】➜【舊式對話框】(都是探討多變數的繪圖)➜設定(種類軸,變數)
第3種【單一變數的頻數分佈圖】:【圖形】➜【舊式對話框】➜設定【類別軸】

※(3).下載問卷調查資料:教師幸福感指數調查
※上傳【32-1-教師幸福感問卷調查_1.xlsx】,到北科大軟體雲的windows電腦的F:\硬碟
※【問卷調查題目】:國小教師職場生活感受調查
........
※【服務地區】:1男,2女
※【服務地區】:1x科任未兼任行政,2x教師兼組長,3x級任未兼任行政,4教師兼主任
※【服務地區】:1北區,2中區,3南區,4東區
※【服務年資】:1:5年以下,2:6-10年,3:11-15年,4:16-20年,5:21-25年,6:26年以上

※(4).用北科大軟體雲的SPSS讀入【32-1-教師幸福感問卷調查_1.xlsx】檔案
讀入問卷檔案,示意圖1

※(5).【如何把x軸的5點量表(1~5)數字,轉成代表意義的文字】:
※【性別,擔任職務】:1x科任,2x組長,3x級任,4主任
➜回到資料工作表區,在【變數視圖】➜點按【性別,擔任職務】這一列➜點按【值】這一欄
......

※(6).【繪線形圖】:『性別,擔任職務 vs 主題幸福感』的統計分佈圖
➜上方【圖形】➜【舊式對話框➜圖表:立體長條圖
指定線形圖,示意圖觀察值群組摘要,示意圖
➜設定【觀察值群組摘要】
➜【x種類軸】➜【性別】
➜【z種類軸】➜【擔任職務】
設定【性別,擔任職務,種類軸】參數
成果『性別,擔任職務』的立體長條圖

※(1).【成果Demo】:繪製【(性別,擔任職務) vs 整體幸福感】的3軸對應關係,用【3D立體長條圖】表示:


※(2).【觀念】:常用的3種畫圖方式
第1種【單一變數的頻數分佈圖】:次數分配表(都是探討單一變數)
第2種【2個變數之間的關聯圖】:【圖形】➜【舊式對話框】(都是探討多變數的繪圖)➜設定(種類軸,變數)
第3種【單一變數的頻數分佈圖】:【圖形】➜【舊式對話框】➜設定【類別軸】

※(3).下載問卷調查資料:教師幸福感指數調查
※上傳【32-1-教師幸福感問卷調查_1.xlsx】,到北科大軟體雲的windows電腦的F:\硬碟
※【問卷調查題目】:國小教師職場生活感受調查
........
※【服務地區】:1男,2女
※【服務地區】:1x科任未兼任行政,2x教師兼組長,3x級任未兼任行政,4教師兼主任
※【服務地區】:1北區,2中區,3南區,4東區
※【服務年資】:1:5年以下,2:6-10年,3:11-15年,4:16-20年,5:21-25年,6:26年以上

※(4).用北科大軟體雲的SPSS讀入【32-1-教師幸福感問卷調查_1.xlsx】檔案
讀入問卷檔案,示意圖1

※(5).【如何把x軸的5點量表(1~5)數字,轉成代表意義的文字】:
※【性別,擔任職務】:1x科任,2x組長,3x級任,4主任
➜回到資料工作表區,在【變數視圖】➜點按【性別,擔任職務】這一列➜點按【值】這一欄
......

※(6).【繪線形圖】:『性別,擔任職務 vs 主題幸福感』的統計分佈圖
➜上方【圖形】➜【舊式對話框➜圖表:立體長條圖
指定線形圖,示意圖觀察值群組摘要,示意圖
➜設定【觀察值群組摘要】
【長條表示】➜選擇【平均值】
➜【變數】➜【整體幸福感】
➜【x種類軸】➜【性別】
➜【z種類軸】➜【擔任職務】
設定【4個參數:長條表示,變數,x種類軸,y種類軸】參數
成果『性別,擔任職務』的立體長條圖

【3-3-A,報表分析(1):線上多層分析處理過程(OLAP, Online Analytical Processing)】

※(1).【成果Demo】:分三層【總計,男,女】的統計分析:


※(2).【觀念】:SPSS的基礎統計分析,包括2種功能:
第1種【報表分析Report】:在【分析】➜【報告】
第2種【描述統計Descriptive Statistics】:在【分析】➜【描述統計】

※(3).【觀念】:SPSS基礎統計分析的用途:
第1種:計算【基礎統計量】:平均,最大,最小,變異數,標準差,標準誤差
第2種:檢定單變數的特徵:常態式檢定,獨立性檢
第3種:探討多變數之間的關係
第4種:根據使用者自訂的格式印出報表

※(4).【觀念】:【報表分析Report】,包括以下4種功能:
第1種【多層分群分析處理,OLAP, Online Analytical Processing】
第2種【觀測值摘要分析處理,Case Summary】
第3種【報表的橫列摘要,Report Summary in Rows】
第4種【報表的直欄摘要,Report Summary in Columns】➔➔➔先從這邊開始學起

※(5).【觀念】:【描述統計Descriptive Statistics】,包括以下5種功能:
第1種【次數分配表,頻數分析,Frequencies】
第2種【描述統計分析,Descriptive Statistics】
第3種【預檢資料,Explore】
第4種【交叉表分析,Cross tables】
第5種【相對比分析,Ratio】

※(6).【說明】:多層分析處理過程(OLAP)
定義:OLAP(Online Analytical Processing)是用於多維數據分析的一種方法,通常用於探索和分析多層次的資料集。它允許用戶從不同的角度來檢視和總結數據,例如按地區、時間、產品等多個維度來查看數據的變化。
用途:主要用於多維數據的快速彙總和分類分析。用戶可以在SPSS中以交叉表格的形式查看資料,根據不同的維度進行切片和鑽取(如按年度、區域、性別等)。這種方式有助於揭示數據中的隱含模式或趨勢。
重點:OLAP強調多層次、多維度的分析,目的是能夠從不同角度深入探索數據的內在規律和特徵。

※(7).【比較】:多層分析處理過程(OLAP),列/欄的報告摘要,觀察值摘要
三者的主要區別:
※A-多層分析處理過程(OLAP):側重於多維度、多層次的資料探索和彙總,通常用於交互式的數據分析和挖掘。
※B-列/欄的報告摘要:專注於對變數的分類匯總,根據列或欄顯示各類別的統計結果,適合呈現單一維度或交叉表格的總結。
※C-觀察值摘要(Cases Summary):主要針對每個個案的統計描述,提供數據集的樣本分佈和缺失情況的總覽。

※(3).下載問卷調查資料:教師幸福感指數調查
※上傳【32-1-教師幸福感問卷調查_1.xlsx】,到北科大軟體雲的windows電腦的F:\硬碟
※【問卷調查題目】:國小教師職場生活感受調查
........
※【服務地區】:1男,2女
※【服務地區】:1x科任未兼任行政,2x教師兼組長,3x級任未兼任行政,4教師兼主任
※【服務地區】:1北區,2中區,3南區,4東區
※【服務年資】:1:5年以下,2:6-10年,3:11-15年,4:16-20年,5:21-25年,6:26年以上

※(4).用北科大軟體雲的SPSS讀入【32-1-教師幸福感問卷調查_1.xlsx】檔案
讀入問卷檔案,示意圖1

※(6).建立【多層分群分析處理,OLAP】
➜上方【分析】➜【報告】➜【OLAP資料方塊]
示意圖
➜設定【摘要變數,目標y=f(x)】➜【整體幸福感】
➜設定【分組變數,x,分群,groupby】➜【性別】 設定分群變數x,目標求值y,示意圖
➜設定【統計計量數】➜【平均,中位數,最大,最小】
點按【統計資料】按鈕,示意圖設定【統計計量數】,示意圖顯示OLAP報表,示意圖
➜設定【標題】➜【國小教師的整體幸福感分層分析】
點按【標題】按鈕,示意圖設定標題文字,示意圖顯示OLAP報表,示意圖

※(7).建立【多層多維度分析】➜【總計,男,女】
➜先在【性別:總計-報表表格】的空白處➜滑鼠右鍵➜【複製】➜貼在下方
複製第1個表格,示意圖貼到之後,示意圖
➜double click【總計】➜選擇【男】
分層【男】的分析,示意圖
➜double click【總計】➜選擇【女】
分層【女】的分析,示意圖
分三層【總計,男,女】的統計分析,示意圖

※(1).【成果Demo】:【(男,北區) vs (男,東區) 比較整體幸福感】的【多層分群分析報表OLAP】
➜分析比較:【男老師,(北區-東區)差異的%是多少?】 = 11.6%


※(2).【觀念】:SPSS的基礎統計分析,包括2種功能:
第1種【報表分析Report】:在【分析】➜【報告】
第2種【描述統計Descriptive Statistics】:在【分析】➜【描述統計】

※(3).【觀念】:SPSS基礎統計分析的用途:
第1種:計算【基礎統計量】:平均,最大,最小,變異數,標準差,標準誤差
第2種:檢定單變數的特徵:常態式檢定,獨立性檢
第3種:探討多變數之間的關係
第4種:根據使用者自訂的格式印出報表

※(4).【觀念】:【報表分析Report】,包括以下4種功能:
第1種【多層分群分析處理,OLAP, Online Analytical Processing】➔step2
第2種【觀測值摘要分析處理,Case Summary】➔step3
第3種【報表的橫列摘要,Report Summary in Rows】➔step4
第4種【報表的直欄摘要,Report Summary in Columns】➔➔➔step1:先從這邊開始學起

※(5).【觀念】:【描述統計Descriptive Statistics】,包括以下5種功能:
第1種【次數分配表,頻數分析,Frequencies】
第2種【描述統計分析,Descriptive Statistics】
第3種【預檢資料,Explore】
第4種【交叉表分析,Cross tables】
第5種【相對比分析,Ratio】



※(3).下載問卷調查資料:教師幸福感指數調查
※上傳【32-1-教師幸福感問卷調查_1.xlsx】,到北科大軟體雲的windows電腦的F:\硬碟
※【問卷調查題目】:國小教師職場生活感受調查
........
※【服務地區】:1男,2女
※【服務地區】:1x科任未兼任行政,2x教師兼組長,3x級任未兼任行政,4教師兼主任
※【服務地區】:1北區,2中區,3南區,4東區
※【服務年資】:1:5年以下,2:6-10年,3:11-15年,4:16-20年,5:21-25年,6:26年以上

※(4).用北科大軟體雲的SPSS讀入【32-1-教師幸福感問卷調查_1.xlsx】檔案
讀入問卷檔案,示意圖1

※(6).建立【多層分群分析處理,OLAP】
➜上方【分析】➜【報告】➜【OLAP資料方塊]
示意圖
➜設定【摘要變數,目標y=f(x)】➜【整體幸福感】
➜設定【分組變數,x,分群,groupby】➜【性別,服務地區】 設定分群變數x,目標求值y,示意圖
➜設定【統計計量數】➜【觀察值數,平均,標準差】
點按【統計資料】按鈕,示意圖設定【統計計量數】,示意圖
➜設定【標題】➜【國小教師(性別,服務地區)的整體幸福感分析】
點按【標題】按鈕,示意圖設定標題文字,示意圖

※(7).建立【多層多維度分析】➜【總計,男/北區,男/東區】
➜先在【性別:總計-報表表格】的空白處➜滑鼠右鍵➜【複製】➜貼在下方
複製第1個表格,貼到之後,
➜double click【總計】➜選擇【男】
➜double click【總計】➜選擇【北區】
分三層【男/北區,男/東區】的統計分析,示意圖

※(8).建立【北區/東區的『差異性』分析】
※【服務地區】:1北區,2中區,3南區,4東區
➜點按【差異】按鈕➜
➜勾選【群組之間的差異】
➜【組別變數】➜選擇【服務地區】
➜【種類】➜輸入【1】(1北區)
➜【減種類】➜輸入【4】(4東區)
➜把2個變數➜移動到【配對】➜(1-4)default
設定參數:北區/東區的『差異性』分析,示意圖
北區/東區的『差異性』分析,示意圖

※(9).分析【男老師,(北區-東區)差異的%是多少?】
➜先在【性別:總計-報表表格】的空白處➜滑鼠右鍵➜【複製】➜貼在下方
複製第1個表格,貼到之後,
➜double click【總計】➜選擇【男】
➜double click【總計】➜選擇【北區】
男老師,在(北區-東區)差異%分析,示意圖
分析【男老師,(北區-東區)差異的%是多少?】 = 11.6%

【3-3-B,報表分析(2,3):列/欄的報告摘要】

※(1).【成果Demo】:國小兒童身高的『列』統計分析(分群不同性別,不同班級):



※(2).【觀念】:SPSS的基礎統計分析,包括2種功能:
第1種【報表分析Report】:在【分析】➜【報告】
第2種【描述統計Descriptive Statistics】:在【分析】➜【描述統計】

※(3).【觀念】:【報表分析Report】,包括以下4種功能:
第1種【多層分群分析處理,OLAP, Online Analytical Processing】➔step2
第2種【觀測值摘要分析處理,Case Summary】➔step3
第3種【報表的橫列摘要,Report Summary in Rows】➔step4
第4種【報表的直欄摘要,Report Summary in Columns】➔➔➔step1:先從這邊開始學起

※(4).【比較】:【報表的橫列摘要 vs 報表的直欄摘要】:
4-1-【列欄的報告摘要】:
雙變數交叉分析:此報告摘要會同時考慮列變數與欄變數,即同時對兩個變數進行分類和匯總,通常用於交叉表分析。它展示的是列與欄交互後的數據分佈情況,如不同組合的頻次、百分比等。
用途:適合於分析兩個變數之間的關係,幫助了解不同變數組合下數據的分佈狀況。
例如,分析性別和年齡組別對購買行為的影響時,可以同時顯示這兩個變數的匯總結果。
展示形式:這類報告摘要通常會以交叉表的形式呈現數據,數據的匯總依賴於列與欄的交互。

4-2-【欄的報告摘要】:
單變數匯總:此報告摘要僅針對欄變數進行匯總,展示的是該變數單一維度下的數據總結。它不會考慮其他變數(如列變數)的分類結果。
用途:適合於單變數的描述性統計分析,
例如:計算某個變數的頻次分佈或均值。這種報告通常用於簡單的匯總分析,不涉及多變數的交互。
展示形式:結果以單列方式呈現,顯示該欄變數的統計信息,數據呈現較為簡單明瞭。

(5). 具體應用情境的差異:
列欄的報告摘要:適合複雜的多變數分析場景,當您需要觀察兩個變數之間的關係時(如交叉分析),這種報告提供了更全面的數據視角。
欄的報告摘要:更適合單變數的簡單數據總結,當您只關心某一變數的統計描述時,使用這種報告更加直觀。



※(4).下載問卷調查資料:國小兒童身高調查
※上傳【33-3-國小兒童身高.sav】,到北科大軟體雲的windows電腦的F:\硬碟

※(5).用北科大軟體雲的SPSS讀入【33-3-國小兒童身高.sav】檔案

※(6).建立【列的報告摘要】
➜上方【分析】➜【報告】➜【列的報告摘要]
示意圖
➜設定【資料欄變數,目標y=f(x)】➜【身高】
➜設定【岔斷欄變數,x,分群,groupby】➜【性別】
➜勾選【顯示觀測值】 設定岔斷變數x,資料欄變數y,示意圖
➜設定【摘要】➜【平均值,觀察值數目】
設定【摘要,統計計量數】,示意圖
➜設定【標題】➜【置中】➜【國小兒童身高的分群分析】
列報表結果:身高欄位太窄,示意圖

※(7).修改【身高的欄位寬度】
➜打開【列的報告摘要】➜【資料欄變數】的【格式】➜【欄寬】=20
設定【欄寬】,示意圖
列報表結果,示意圖

※(8).修改【每個性別(男,女)下都有計算平均值】
➜打開【列的報告摘要】➜【岔斷變數】的【摘要】➜勾選【平均值】
設定【岔斷變數】的【摘要】,示意圖
列報表結果,示意圖

※(9).設定【2個岔斷變數:性別,班級】
➜打開【列的報告摘要】➜新增1個【岔斷變數】:【班級】
➜設定【岔斷變數】的【摘要】➜勾選【平均值】
設定【岔斷變數】的【摘要】,示意圖
列報表結果(男),示意圖
列報表結果(女),示意圖

※(1).【成果Demo】:國小兒童身高的『欄位』統計分析(分群不同性別,不同班級):


※(2).【觀念】:SPSS的基礎統計分析,包括2種功能:
第1種【報表分析Report】:在【分析】➜【報告】
第2種【描述統計Descriptive Statistics】:在【分析】➜【描述統計】

※(3).【觀念】:【報表分析Report】,包括以下4種功能:
第1種【多層分群分析處理,OLAP, Online Analytical Processing】➔step2
第2種【觀測值摘要分析處理,Case Summary】➔step3
第3種【報表的橫列摘要,Report Summary in Rows】➔step4
第4種【報表的直欄摘要,Report Summary in Columns】➔➔➔step1:先從這邊開始學起

※(4).【比較】:【報表的橫列摘要 vs 報表的直欄摘要】:
4-1-【列欄的報告摘要】:
雙變數交叉分析:此報告摘要會同時考慮列變數與欄變數,即同時對兩個變數進行分類和匯總,通常用於交叉表分析。它展示的是列與欄交互後的數據分佈情況,如不同組合的頻次、百分比等。
用途:適合於分析兩個變數之間的關係,幫助了解不同變數組合下數據的分佈狀況。
例如,分析性別和年齡組別對購買行為的影響時,可以同時顯示這兩個變數的匯總結果。
展示形式:這類報告摘要通常會以交叉表的形式呈現數據,數據的匯總依賴於列與欄的交互。

4-2-【欄的報告摘要】:
單變數匯總:此報告摘要僅針對欄變數進行匯總,展示的是該變數單一維度下的數據總結。它不會考慮其他變數(如列變數)的分類結果。
用途:適合於單變數的描述性統計分析,
例如:計算某個變數的頻次分佈或均值。這種報告通常用於簡單的匯總分析,不涉及多變數的交互。
展示形式:結果以單列方式呈現,顯示該欄變數的統計信息,數據呈現較為簡單明瞭。

(5). 具體應用情境的差異:
列欄的報告摘要:適合複雜的多變數分析場景,當您需要觀察兩個變數之間的關係時(如交叉分析),這種報告提供了更全面的數據視角。
欄的報告摘要:更適合單變數的簡單數據總結,當您只關心某一變數的統計描述時,使用這種報告更加直觀。



※(4).下載問卷調查資料:國小兒童身高調查
※上傳【33-3-國小兒童身高.sav】,到北科大軟體雲的windows電腦的F:\硬碟

※(5).用北科大軟體雲的SPSS讀入【33-3-國小兒童身高.sav】檔案

※(6).建立【列的報告摘要】
➜上方【分析】➜【報告】➜【欄位的報告摘要]
示意圖
➜在最下方顯示整體平均➜點按【摘要】➜勾選【顯示總計】
設定【摘要】【顯示總計】,示意圖
➜設定【標題】➜【置中】➜【國小兒童身高的分群分析】

※(7).設定【資料欄變數】
列報表結果:身高欄位太窄,示意圖
➜設定『每個欄位只顯示平均,不顯示個別值』➜點按【資料欄變數】➜【摘要】➜勾選【平均值】
資料欄變數只顯示平均,示意圖
➜設定【資料欄變數】的欄位寬度➜點按【格式】➜【欄寬】=20
設定資料欄(身高)的欄寬,示意圖

※(8).設定岔斷變數【性別】
➜點按【性別】➜【選項】➜勾選【顯示小計】
設定資料欄(性別)的選項,示意圖
➜點按【班級】➜【選項】➜勾選【顯示小計】
設定資料欄(班級)的選項,示意圖
欄的成果摘要成果,示意圖

【3-3-C,報表分析(4):觀察值摘要 Cases Summary】

※(1).【成果Demo】:國小兒童身高的統計分析(分群不同性別,不同班級):


※(2).【觀念】:SPSS的基礎統計分析,包括2種功能:
第1種【報表分析Report】:在【分析】➜【報告】
第2種【描述統計Descriptive Statistics】:在【分析】➜【描述統計】

※(3).【觀念】:【報表分析Report】,包括以下4種功能:
第1種【多層分群分析處理,OLAP, Online Analytical Processing】➔step2
第2種【觀測值摘要分析處理,Case Summary】➔step3
第3種【報表的橫列摘要,Report Summary in Rows】➔step4
第4種【報表的直欄摘要,Report Summary in Columns】➔➔➔step1:先從這邊開始學起

※(4).【說明】:觀察值摘要(Cases Summary)
※定義:觀察值摘要是針對數據集中各個個案(即觀察值、樣本)的基本統計彙總。它提供的是數據集中每個觀察值的數量、缺失值以及基本的統計描述(如均值、標準差、最小值、最大值等)。
※用途:這種摘要主要用於描述數據集中個案的整體概況,幫助使用者了解樣本的分佈情況,是否有缺失資料,以及每個觀察值在數據集中的特性。這類摘要報告可以協助檢查數據品質和整體分佈情況。
※重點:觀察值摘要關注於個別樣本的統計總結,展示的是個案層級的資料而非分類或多維分析結果。

※(5).【本題重點】:雖然使用觀察值摘要(Cases Summary),但卻要取消【觀察觀察值摘要】
※原因:因為若是打勾要顯示【觀察值摘要】,會導致每個分群變數,都會顯示她的【觀察值的摘要】:統計描述(如均值、標準差、最小值、最大值等)。

※所以:我們要取消勾選【觀察值摘要】,才不會顯示的太複雜



※(4).下載問卷調查資料:國小兒童身高調查
※上傳【33-3-國小兒童身高.sav】,到北科大軟體雲的windows電腦的F:\硬碟

※(5).用北科大軟體雲的SPSS讀入【33-3-國小兒童身高.sav】檔案

※(6).建立【觀察值摘要 Cases Summar】
➜上方【分析】➜【報告】➜【觀察值摘要 Cases Summar]
示意圖
➜設定【變數,目標y=f(x)】➜【身高】
➜設定【分組變數,x,分群,groupby】➜【性別,班級】
➜取消勾選【顯示觀測值】 設定變數x,分組變數y,示意圖
➜設定【統計資料】➜【觀察值數目(樣本數N),平均值,中位數】
設定【統計資料,統計計量數】,示意圖
➜設定【選項(標題)】➜【標題】➜【國小兒童身高的分群分析】
設定標題,示意圖

報表結果,示意圖

【3-4-A,描述統計(1):次數分配表(Frequencies,頻數分析)】

※(1).【成果Demo】:【120名男子血壓分佈】的【次數分配表(Frequencies,頻數分析)】:




※(2).【觀念】:SPSS的基礎統計分析,包括2種功能:
第1種【報表分析Report】:在【分析】➜【報告】
第2種【描述統計Descriptive Statistics】:在【分析】➜【描述統計】

※(3).【觀念】:【描述統計Descriptive Statistics】,包括以下5種功能:
第1種【次數分配表,頻數分析,Frequencies】
第2種【描述統計分析,Descriptive Statistics】
第3種【預檢資料,Explore】
第4種【交叉表分析,Cross tables】
第5種【相對比分析,Ratio】

※(4).下載問卷調查資料:120名男子血壓調查
※上傳【34-1-120名男子血壓分佈.sav】,到北科大軟體雲的windows電腦的F:\硬碟

※(5).用北科大軟體雲的SPSS讀入【34-1-120名男子血壓分佈.sav】檔案

※(6).建立【次數分配表(Frequencies,頻數分析)】
➜上方【分析】➜【描述統計】➜【次數分配表(Frequencies,頻數分析)】
示意圖
➜設定【變數,目標y=f(x)】➜【舒張壓】 設定變數x舒張壓,示意圖
➜設定【統計資料】➜勾選【大部分參數】
設定【統計資料,統計計量數】,示意圖
➜設定【圖表】➜【直方圖】➜並勾選【在直方圖上顯示常態曲線】
設定圖表,示意圖

報表結果,示意圖
報表結果,示意圖
直方圖+常態分佈圖,示意圖

※(1).【成果Demo】:【100名大學生血清蛋白分佈】的【次數分配表(Frequencies,頻數分析)】:




※(2).【觀念】:SPSS的基礎統計分析,包括2種功能:
第1種【報表分析Report】:在【分析】➜【報告】
第2種【描述統計Descriptive Statistics】:在【分析】➜【描述統計】

※(3).【觀念】:【描述統計Descriptive Statistics】,包括以下5種功能:
第1種【次數分配表,頻數分析,Frequencies】
第2種【描述統計分析,Descriptive Statistics】
第3種【預檢資料,Explore】
第4種【交叉表分析,Cross tables】
第5種【相對比分析,Ratio】

※(4).下載問卷調查資料:100名大學生血清蛋白分佈
※上傳【34-2-100名大學生血清蛋白分佈.sav】,到北科大軟體雲的windows電腦的F:\硬碟

※(5).用北科大軟體雲的SPSS讀入【34-2-100名大學生血清蛋白分佈.sav】檔案

※(6).建立【次數分配表(Frequencies,頻數分析)】
➜上方【分析】➜【描述統計】➜【次數分配表(Frequencies,頻數分析)】
➜設定【變數,目標y=f(x)】➜【血清蛋白】
➜設定【統計資料】➜勾選【大部分參數】
➜設定【圖表】➜【直方圖】➜並勾選【在直方圖上顯示常態曲線】

報表結果,示意圖
報表結果,示意圖
直方圖+常態分佈圖,示意圖

【3-4-B-描述統計(2):描述統計(描述統計分析,Descriptive Statistics)】

※(1).【成果Demo】:【期末考English成績】的【描述統計分析,Descriptive Statistics】:


※(2).【觀念】:SPSS的基礎統計分析,包括2種功能:
第1種【報表分析Report】:在【分析】➜【報告】
第2種【描述統計Descriptive Statistics】:在【分析】➜【描述統計】

※(3).【觀念】:【描述統計Descriptive Statistics】,包括以下5種功能:
第1種【次數分配表,頻數分析,Frequencies】
第2種【描述統計分析,Descriptive Statistics】
第3種【預檢資料,Explore】
第4種【交叉表分析,Cross tables】
第5種【相對比分析,Ratio】

※(4).下載問卷調查資料:期末考成績的描述統計
※上傳【34-3-期末考成績的描述統計.sav】,到北科大軟體雲的windows電腦的F:\硬碟

※(5).用北科大軟體雲的SPSS讀入【34-3-期末考成績的描述統計.sav】檔案

※(6).建立【次數分配表(Frequencies,頻數分析)】
➜上方【分析】➜【描述統計】➜【描述統計分析】
示意圖
➜設定【變數】➜【english】 設定變數English,示意圖
➜設定【選項】➜勾選【大部分參數】
設定【統計計量數】,示意圖

報表結果,示意圖

※(1).【成果Demo】:【20名嬰兒體重】的【描述統計分析,Descriptive Statistics】:


※(2).【觀念】:SPSS的基礎統計分析,包括2種功能:
第1種【報表分析Report】:在【分析】➜【報告】
第2種【描述統計Descriptive Statistics】:在【分析】➜【描述統計】

※(3).【觀念】:【描述統計Descriptive Statistics】,包括以下5種功能:
第1種【次數分配表,頻數分析,Frequencies】
第2種【描述統計分析,Descriptive Statistics】
第3種【預檢資料,Explore】
第4種【交叉表分析,Cross tables】
第5種【相對比分析,Ratio】

※(4).下載問卷調查資料:20名嬰兒體重的描述統計
※上傳【34-4-20名嬰兒體重的描述統計.sav】,到北科大軟體雲的windows電腦的F:\硬碟

※(5).用北科大軟體雲的SPSS讀入【34-4-20名嬰兒體重的描述統計.sav】檔案

※(6).建立【次數分配表(Frequencies,頻數分析)】
➜上方【分析】➜【描述統計】➜【描述統計分析】
➜設定【變數】➜【english】
➜設定【選項】➜勾選【5個參數】
勾選【5個參數】,示意圖
➜設定【圖表】➜【直方圖】➜並勾選【在直方圖上顯示常態曲線】

報表結果,示意圖

【3-4-C-描述統計(3):預檢資料,Explore】

※(1).【成果Demo】:【一週飲料花費】的【預檢資料,Explore】:




(2).【觀念】:什麼是Explore「預檢」功能: ※ 探索Explore 功能通常用於進行資料的「預檢」,即在進行更複雜的統計分析之前,了解資料的基本性質和特徵。例如:數據的分佈是否有異常點?
一般常用的「預檢」有以下幾個功能:
第1種【做分組分群統計摘要分析+圖形分組比對】
第2種【看出數據是否有異常值】
第3種【看出數據是否符合常態分佈】

※(3).【觀念】:SPSS的基礎統計分析,包括2種功能:
第1種【報表分析Report】:在【分析】➜【報告】
第2種【描述統計Descriptive Statistics】:在【分析】➜【描述統計】

※(3).【觀念】:【描述統計Descriptive Statistics】,包括以下5種功能:
第1種【次數分配表,頻數分析,Frequencies】
第2種【描述統計分析,Descriptive Statistics】
第3種【預檢資料,Explore】
第4種【交叉表分析,Cross tables】
第5種【相對比分析,Ratio】

※(4).【觀念】:SPSS可以做【分組/分群統計摘要】的有以下幾種:
第1種【觀測值摘要】
第2種【線上多層分析處理過程(OLAP)】
第3種【列/欄的報告摘要】
第4種【預檢資料,Explore】

※(5).下載問卷調查資料:一週飲料花費
※上傳【34-5-一週飲料花費.sav】,到北科大軟體雲的windows電腦的F:\硬碟

※(6).用北科大軟體雲的SPSS讀入【34-5-一週飲料花費.sav】檔案

※(7).建立【預檢資料,Explore】
➜上方【分析】➜【描述統計】➜【預檢資料,Explore】
示意圖
➜設定【依變數清單】➜【飲料花費】
➜設定【因子清單】➜【性別】 設定變數,示意圖
➜設定【統計資料】➜勾選【敘述統計】
設定【統計計量數】,示意圖
➜設定【圖形】➜勾選【直方圖】
設定直方圖,示意圖

報表結果,示意圖
報表結果,示意圖
報表結果,示意圖

※(1).【成果Demo】:【一週飲料花費】的【預檢資料,Explor】:看數據是否有【異常值】
➜方法:看盒形圖,若有外圍的o數據,即是有異常值(太大,太小值數據)

※(1).【成果Demo】:【一週飲料花費】的【預檢資料,Explor】:看數據是否接近【常態分佈】


➜【判斷1】➜由【QQ常態機率圖】來觀察男生女生的數據,都沒有緊密地與斜線重合,表示數據點沒有符合常態分佈
➜【判斷2】➜由【離勢/除勢QQ常態機率圖】來觀察男生女生的數據,有些數據遠離y=0的水平線,表示數據點沒有符合常態分佈
➜【印證】➜看【直方圖】:數據的分佈圖,沒有常態分佈


※(2).【觀念】:SPSS【預檢資料,Explore】的功能,有以下幾種:
第1種【做分組分群統計摘要分析+圖形分組比對】
第2種【看出數據是否有異常值】
第3種【看出數據是否符合常態分佈】

※(3).下載問卷調查資料:一週飲料花費
※上傳【34-5-一週飲料花費.sav】,到北科大軟體雲的windows電腦的F:\硬碟

※(4).用北科大軟體雲的SPSS讀入【34-5-一週飲料花費.sav】檔案

※(5).練習【判斷數據是否有異常值】
➜上方【分析】➜【描述統計】➜【預檢資料,Explore】
➜設定【依變數清單】➜【飲料花費】
➜設定【因子清單】➜【性別】
➜設定【圖形】➜勾選【盒形圖】➜【結合因子水準】
設定盒形圖的參數,示意圖
由盒形圖外圍o數據判斷是否有異常值,示意圖
異常值定義:【數據中太大或太小值的資料點】
異常值判斷方法:【在盒形圖的外圍鬚鬚的o點,就是太大或太小的數據】

※(6).練習【判斷數據是否符合常態分佈】
➜上方【分析】➜【描述統計】➜【預檢資料,Explore】
➜設定【圖形】➜勾選【常態圖】
設定判斷常態分佈的QQ常態圖,示意圖

成果圖:男生花在飲料費的【QQ常態機率圖】,示意圖
成果圖:女生花在飲料費的【QQ常態機率圖】,示意圖
成果圖:男生花在飲料費的【離勢QQ常態機率圖】,示意圖
成果圖:女生花在飲料費的【離勢QQ常態機率圖】,示意圖

※(7).如何判斷是否數據有常態分佈,方法1:【看QQ常態機率圖上面的點,若都緊密地符合在斜線上分佈,表示數據有常態分佈】
※如何判斷是否數據有常態分佈,方法2:【看離勢QQ常態機率圖上面的點,若數據點都在水平線y=0上下分佈,表示數據有常態分佈】
➜【判斷1】➜由【QQ常態機率圖】來觀察男生女生的數據,都沒有緊密地與斜線重合,表示數據點沒有符合常態分佈
➜【判斷2】➜由【離勢/除勢QQ常態機率圖】來觀察男生女生的數據,有些數據遠離y=0的水平線,表示數據點沒有符合常態分佈

➜【印證】➜看【直方圖】:數據的分佈圖:
直方圖顯示沒有常態分佈,示意圖

※(1).【成果Demo】:【120名男子血壓分佈】的【預檢資料,Explor】:看數據是否有【異常值】
➜方法:看盒形圖,若沒有外圍的o數據,即表示沒有異常值(太大,太小值數據)

※(1).【成果Demo】:【120名男子血壓分佈】的【預檢資料,Explor】:看數據是否接近【常態分佈】



➜【判斷1】➜由【QQ常態機率圖】來觀察男生女生的數據,都沒有緊密地與斜線重合,表示數據點沒有符合常態分佈
➜【判斷2】➜由【離勢/除勢QQ常態機率圖】來觀察男生女生的數據,有些數據遠離y=0的水平線,表示數據點沒有符合常態分佈

※(2).【觀念】:SPSS【預檢資料,Explore】的功能,有以下幾種:
第1種【做分組分群統計摘要分析+圖形分組比對】
第2種【看出數據是否有異常值】
第3種【看出數據是否符合常態分佈】

※(3).下載問卷調查資料:120名男子血壓調查
※上傳【34-10-120名男子血壓分佈.sav】,到北科大軟體雲的windows電腦的F:\硬碟

※(4).用北科大軟體雲的SPSS讀入【34-10-120名男子血壓分佈.sav】檔案

※(5).練習【判斷數據是否有異常值】
➜上方【分析】➜【描述統計】➜【預檢資料,Explore】
➜設定【依變數清單】➜【舒張壓】
➜設定【圖形】➜勾選【盒形圖】➜【結合因子水準】
由盒形圖外圍o數據判斷是否有異常值,示意圖
異常值定義:【數據中太大或太小值的資料點】
異常值判斷方法:【在盒形圖的外圍鬚鬚的o點,就是太大或太小的數據】

※(6).練習【判斷數據是否符合常態分佈】
➜上方【分析】➜【描述統計】➜【預檢資料,Explore】
➜設定【圖形】➜勾選【常態圖】
成果圖:舒張壓的【QQ常態機率圖】,示意圖
成果圖:舒張壓的【離勢/除勢QQ常態機率圖】,示意圖
※(7).如何判斷是否數據有常態分佈,方法1:【看QQ常態機率圖上面的點,若都緊密地符合在斜線上分佈,表示數據有常態分佈】
※如何判斷是否數據有常態分佈,方法2:【看離勢QQ常態機率圖上面的點,若數據點都在水平線y=0上下分佈,表示數據有常態分佈】
➜【判斷1】➜由【QQ常態機率圖】來觀察血壓數據,都緊密地與斜線重合,表示數據點符合常態分佈
➜【判斷2】➜由【離勢/除勢QQ常態機率圖】來觀察血壓數據,數據緊靠y=0的水平線(-0.1~0.1),表示數據點符合常態分佈

➜【印證】➜看【直方圖】:數據的分佈圖:
直方圖顯示常態分佈,示意圖

☎【3-5-交叉分析表,Cross Tables】:探討2個類別變數之間的關聯性(重要)

※(1).【成果Demo】:【ABC三個品牌與喜歡原因DEF之間的關聯性】的【交叉分析表解析】➜分析報告【SPSS➜Excel➜Word】:






※(2).【觀念】:SPSS的基礎統計分析,包括2種功能:
第1種【報表分析Report】:在【分析】➜【報告】
第2種【描述統計Descriptive Statistics】:在【分析】➜【描述統計】

※(3).【觀念】:【描述統計Descriptive Statistics】,包括以下5種功能:
第1種【次數分配表,頻數分析,Frequencies】
第2種【描述統計分析,Descriptive Statistics】
第3種【預檢資料,Explore】
第4種【交叉表分析,Cross tables】
第5種【相對比分析,Ratio】

※(4).☎【非常重要】:【交叉表分析,Cross tables】的功用:
【功用】:探討2個【類別變數】之間的【關聯性】
【範例1】:選舉時,探討【不同地區】對A候選人【是否支持】
【範例2】:選舉時,探討【性別】對甲政黨【是否支持】
【範例3】:行銷研究,探討【教育程度】對【不同品牌】的偏好
【範例4】:行銷研究,探討【喜好不同品牌】對【購買原因】的關聯度

※(4).下載問卷調查資料:品牌偏好原因
※上傳【35-1-品牌偏好原因.sav】,到北科大軟體雲的windows電腦的F:\硬碟

※(5).用北科大軟體雲的SPSS讀入【35-1-品牌偏好原因.sav】檔案

※(6).建立【『偏好原因vs品牌』的計數值比較】
➜上方【分析】➜【描述統計】➜【交叉表分析,Cross tables】
➜設定【列】➜【偏好原因】
➜設定【欄】➜【品牌】
➜設定【資料格】➜勾選【計數】的【觀測值】
設定【列,欄,觀測值】,示意圖
成果【『偏好原因vs品牌』的計數值比較】,示意圖

※(7).建立【『偏好原因vs品牌』的百分比比較】
➜上方【分析】➜【描述統計】➜【交叉表分析,Cross tables】
➜設定【列】➜【偏好原因】
➜設定【欄】➜【品牌】
➜設定【資料格】➜勾選【百分比】的【欄位】
設定【欄的百分比】,示意圖
成果【『偏好原因vs品牌』的百分比比較】,示意圖

※(8).建立【『偏好原因vs品牌』的『計數,百分比』比較】
➜上方【分析】➜【描述統計】➜【交叉表分析,Cross tables】
➜設定【列】➜【偏好原因】
➜設定【欄】➜【品牌】
➜設定【資料格】➜勾選【計數】的【觀測值】
➜設定【資料格】➜勾選【百分比】的【欄位】
設定【計數,欄的百分比】,示意圖
成果【『偏好原因vs品牌』的『計數,百分比』比較】,示意圖

※(9).將3個SPSS的交叉分析表表格【複製】到【Excel】
➜在每1個表格➜【滑鼠右鍵】➜【複製】
【複製表格】,示意圖
➜貼到Excel去編輯每1個表格
【貼3個表格到Excel編輯】,示意圖

※(10).再將3個【Excel】表格,複製到Word寫分析報告
【複製表格到Word】,示意圖
【複製表格到Word】,示意圖

※(1).【成果Demo】:【品牌與喜好原因】的【交叉分析表應用】➜變成三種定量分析的百分比表格➜可說出數據背後的3種物理意義,與定量比對




35-2.word分析報告【偏好原因-品牌】

※(2).☎【非常重要】:【交叉表分析,Cross tables】的功用:
【功用】:探討2個【類別變數】之間的【關聯性】
【範例1】:選舉時,探討【不同地區】對A候選人【是否支持】
【範例2】:選舉時,探討【性別】對甲政黨【是否支持】
【範例3】:行銷研究,探討【教育程度】對【不同品牌】的偏好
【範例4】:行銷研究,探討【喜好不同品牌】對【購買原因】的關聯度

※(3).☎【非常重要】:【交叉分析表➜轉成➜定量分析的百分比表格】,有三種:
•(A)第1種:【總計百分比】:以總和當分母(右下角為100,右下角值=df.iloc[-1,-1])
➜看【總和2:列】:『Fri Sat Sun Thur』的消費比例是『6.75,36.84,33.70,22.71』,所以本店, 在週五消費額最少,週六消費額最高
➜看【總和1:欄】:一周總和1『Female,Male』的消費比例是『32.54,67.46』,男生是主要消費族群


•(B)第2種:【欄的總和百分比】:以欄的總和當分母
➜看第1欄:Fri週五『Female,Male』的消費比例是『39.07,60.93』
➜...
➜看第4欄:Thur週四『Female,Male』的消費比例是『48.79,51.21』
➜所以本店,週六~週日,男生是主消費族群,但是週四男生消費額減少


•(C)第3種:【列的總和百分比】:以列的總和當分母
➜看第1列:Female在『Fri Sat Sun Thur』的消費比例是『8.10,35.08,22.77,34.05』
➜看第2列:Male在『Fri Sat Sun Thur』的消費比例是『6.10,37.69,38.98,17.24』
➜看第3列:Female+Male在『Fri Sat Sun Thur』的消費比例是『6.75,36.84,33.70,22.71』
➜所以本店,女生+男生在週五消費額最少,週六消費額最高


※(4).下載問卷調查資料:品牌偏好原因
※上傳【35-1-品牌偏好原因.sav】,到北科大軟體雲的windows電腦的F:\硬碟

※(5).用北科大軟體雲的SPSS讀入【35-1-品牌偏好原因.sav】檔案

※(6).建立【『偏好原因vs品牌』的『百分比-總計』比較】
➜上方【分析】➜【描述統計】➜【交叉表分析,Cross tables】
➜設定【列】➜【偏好原因】
➜設定【欄】➜【品牌】
➜設定【資料格】➜勾選【百分比】的【總計】
設定【百分比-總計】,示意圖
成果【『偏好原因vs品牌』的『百分比-總計』比較】,示意圖

※(7).建立【『偏好原因vs品牌』的『百分比-欄』比較】
➜上方【分析】➜【描述統計】➜【交叉表分析,Cross tables】
➜設定【列】➜【偏好原因】
➜設定【欄】➜【品牌】
➜設定【資料格】➜勾選【百分比】的【欄位】
成果【『偏好原因vs品牌』的百分比比較】,示意圖

※(8).建立【『偏好原因vs品牌』的『百分比-列』比較】
➜上方【分析】➜【描述統計】➜【交叉表分析,Cross tables】
➜設定【列】➜【偏好原因】
➜設定【欄】➜【品牌】
➜設定【資料格】➜勾選【百分比】的【列】
成果【『偏好原因vs品牌』的『計數,百分比』比較】,示意圖

※(8).將3個SPSS的交叉分析表表格【複製】到【Excel】
➜在每1個表格➜【滑鼠右鍵】➜【複製】
➜貼到Excel去編輯每1個表格
【貼3個表格到Excel編輯】,示意圖

※(9).再將3個【Excel】表格,複製到Word寫分析報告

35-2.word分析報告【偏好原因-品牌】

35-4.Final完整的word分析報告【偏好原因-品牌】

※(1).【成果Demo】:【交叉分析表的長條圖比較:可以一眼看出關聯因子的關聯特色】:【品牌與喜好原因】交叉分析後以長條圖比較



35-3.word分析報告【偏好原因-品牌】

※(2).☎【非常重要】:【交叉表分析,Cross tables】的功用:
【功用】:探討2個【類別變數】之間的【關聯性】
【範例1】:選舉時,探討【不同地區】對A候選人【是否支持】
【範例2】:選舉時,探討【性別】對甲政黨【是否支持】
【範例3】:行銷研究,探討【教育程度】對【不同品牌】的偏好
【範例4】:行銷研究,探討【喜好不同品牌】對【購買原因】的關聯度

※(3).下載問卷調查資料:品牌偏好原因
※上傳【35-1-品牌偏好原因.sav】,到北科大軟體雲的windows電腦的F:\硬碟

※(4).用北科大軟體雲的SPSS讀入【35-1-品牌偏好原因.sav】檔案

※(5).建立【交叉分析表的長條圖比較:性別 vs 品牌】
➜上方【分析】➜【描述統計】➜【交叉表分析,Cross tables】
➜設定【列】➜【性別】(注意:【列】是圖形的x軸
➜設定【欄】➜【品牌】
勾選【顯示集群長條圖】
➜不需要設定【資料格】➜因為長條圖,只能夠顯示『計數值』
設定【顯示集群長條圖】,示意圖
成果【『性別vs品牌』長條圖】,示意圖
➜【結論】:男生比較喜歡A品牌,女生比較喜歡C品牌

➜x,y軸顛倒配置
設定【列】➜【品牌】(注意:【列】是圖形的x軸
➜設定【欄】➜【性別】
成果【『品牌vs性別』長條圖】,示意圖
➜【結論】:A品牌比較多男生喜歡,C品牌比較多女生喜歡,B品牌男生女生喜歡的差不多

※(6).建立【交叉分析表的長條圖比較:性別 vs 偏好原因】
成果【『性別 vs 偏好原因』長條圖】,示意圖
➜【結論】:男生比較在意的是【價格便宜】,女生比較在意的是【外形美觀】
成果【『偏好原因 vs 性別』長條圖】,示意圖
➜【結論】:偏好【價格便宜】的多數是【男生】,偏好【外形美觀】的多數是【女生】,偏好【品質優良】的【男女差不多】

※(7).建立【交叉分析表的長條圖比較:品牌 vs 偏好原因】
成果【『品牌 vs 偏好原因』長條圖】,示意圖
➜【結論】:會選擇【A品牌】的多是因為【價格便宜】,
➜【結論】:會選擇【B品牌】的多是因為【品質優良】
➜【結論】:會選擇【C品牌】的多是因為【外形美觀】
成果【『偏好原因 vs 品牌』長條圖】,示意圖
➜【結論】:偏好【價格便宜】的多數會選【A品牌】
➜【結論】:偏好【品質優良】的多數會選【B品牌】
➜【結論】:偏好【外形美觀】的多數會選【C品牌】

※(8).【結論】
➜【結論1】:用【交叉分析表】的長條圖,可以一眼看出關聯因子的關聯特色
➜【結論2】:看(x,y)軸的對應長條圖,只需要做一次即可,不需要(x,y),(y,x)做2次,因為結論相同
➜【結論3】:SPSS的交叉分析表之對應長條圖,只能夠顯示【計數值】,無法顯示【百分比】

35-3.word分析報告【偏好原因-品牌】

35-4.Final完整的word分析報告【偏好原因-品牌】

※(1).【成果Demo】:客戶【每個月到星巴克的次數】與【性別】是否存在顯著關聯?】

【靈魂拷問,大哉問】:客戶【每個月到星巴克的次數】與【性別】是否存在顯著關聯?】
35-4.Final完整的word分析報告

※(2).☎【非常重要】:【交叉表分析,Cross tables】的功用:
【功用】:探討2個【類別變數】之間的【關聯性】
【範例1】:選舉時,探討【不同地區】對A候選人【是否支持】
【範例2】:選舉時,探討【性別】對甲政黨【是否支持】
【範例3】:行銷研究,探討【教育程度】對【不同品牌】的偏好
【範例4】:行銷研究,探討【喜好不同品牌】對【購買原因】的關聯度

※(3).下載問卷調查資料:星巴克每個月消費次數與零用金關聯
※上傳【35-4-星巴克每個月消費次數與零用金關聯.sav】,到北科大軟體雲的windows電腦的F:\硬碟

※(4).用北科大軟體雲的SPSS讀入【35-4-星巴克每個月消費次數與零用金關聯.sav】檔案
➜此問卷共有200份受訪者填寫
➜【次數】:每個月到星巴克消費次數,1為<=3次,2為4~9次,3為>=10次
➜【零用金】:每個月可支配的零用金,1為<=5000,2為5001~10000次,3為>=10001次
➜【性別】:1為男,2為女

※(5).建立【交叉分析表:每個月到星巴克消費次數 vs 性別】
➜上方【分析】➜【描述統計】➜【交叉表分析,Cross tables】
➜設定【列】➜【每個月到星巴克消費次數】
➜設定【欄】➜【性別】
➜設定【資料格】➜【計數】➜【觀察值】

【靈魂拷問,大哉問】:客戶【每個月到星巴克的次數】與【性別】是否存在顯著關聯?】
【重要觀念】:探討問卷調查中2個變數之間是否有關聯,無法目測,必須用【獨立性檢定Test】,檢定後才能知道是否2個變數有關聯?
➜【觀察1】:若是觀察樣本數(觀察值),似乎男生的次數少,女生的次數多,似乎【次數】與【性別】有關聯
➜【請問】:你能夠說【到星巴克購買的女生購買次數多於男生嗎?
你能夠說【購買次數與性別有關聯嗎】?


※(6).比較【交叉分析表:次數 vs 性別】以【百分比】方式表示
設定【百分比-欄】,示意圖

➜【發現】:不論購買次數【低,或高】,男女的比例,都是差不多
【結論】:探討問卷調查中2個變數之間是否有關聯,不能夠用樣本數(計數)來比較,必須轉換成【百分比】才準確

※(7).【統計檢定】:判斷2個變數是否有關聯
【請問】:探討這個問卷的2個變數【次數,性別】的關聯性,必須採用哪一種檢定?
☎【判斷檢定方法的最重要圖表】:
➜根據(x, y)對應的不同格式,可以選擇不同的統計檢定方法:


【重要觀念】:若2個變數都是【類別,種類】變數(性別,地區,是否有房子,是否有汽車),
即【類別 vs 類別】變數的關聯性, 則必須用【卡方檢定】

☎【結論】:【類別 vs 類別】用【卡方檢定(χ² test)】

※(8).建立【交叉分析表:次數 vs 性別】的【統計檢定】
➜設定【統計資料】➜勾選【卡方檢定】
勾選【卡方檢定】,示意圖

➜【注意1】:查表【卡方分配表】的【顯著水準➜一般都是以 α = 0.05來設定】
➜【判別技巧1】:若是我們計算出來的【漸近顯著性】值< 0.05,表示【2個變數之間呈現顯著性關聯】
➜【判別技巧2】:若是我們計算出來的【漸近顯著性】值> 0.05,表示【2個變數之間沒有關聯】

➜【注意2】:df是自由度,degree of freedom
➜【注意3】:數值 = 卡方值 = χ² = Chi-Square
➜☎【結論】:計算結果的【漸近顯著性】值 = 0.905 > 0.05,表示【2個變數之間沒有關聯】
➜☎【表示】:受訪者到星巴克的【次數高低】,並不會因為【性別】而有顯著差異


※(9).【判斷2個變數之間是否有顯著關聯】的【統計檢定】步驟:
➜卡方獨立性檢定(Chi-Square Test of Independence):適用於類別變數。
➜步驟1:設置2種假設:
◉零假設(𝐻0):兩個變數之間獨立(無顯著關聯)。
◉對立假設(𝐻1):兩個變數之間不獨立(有顯著關聯)。
➜步驟2:根據數據構建列聯表(交叉表)。
➜步驟3:計算卡方統計量(𝜒2):使用公式計算卡方值。
➜步驟4:計算p值:根據卡方值和自由度,查找對應的p值。
➜步驟5:比較顯著水平:如果p值小於顯著水平(如0.05),則拒絕零假設,認為兩變數之間有顯著關聯。



35-4.Final完整的word分析報告

※(1).【成果Demo】:客戶【每個月到星巴克的次數】與【每月可支配的零用金】是否存在顯著關聯?

【請問】:客戶【每個月到星巴克的次數】與【可支配的零用金】是否存在顯著關聯?】
35-5.Final完整的word分析報告

※(2).☎【非常重要】:【交叉表分析,Cross tables】的功用:
【功用】:探討2個【類別變數】之間的【關聯性】
【範例1】:選舉時,探討【不同地區】對A候選人【是否支持】
【範例2】:選舉時,探討【性別】對甲政黨【是否支持】
【範例3】:行銷研究,探討【教育程度】對【不同品牌】的偏好
【範例4】:行銷研究,探討【喜好不同品牌】對【購買原因】的關聯度

※(3).下載問卷調查資料:星巴克每個月消費次數與零用金關聯
※上傳【35-4-星巴克每個月消費次數與零用金關聯.sav】,到北科大軟體雲的windows電腦的F:\硬碟

※(4).用北科大軟體雲的SPSS讀入【35-4-星巴克每個月消費次數與零用金關聯.sav】檔案
➜此問卷共有200份受訪者填寫
➜【次數】:每個月到星巴克消費次數,1為<=3次,2為4~9次,3為>=10次
➜【零用金】:每個月可支配的零用金,1為<=5000,2為5001~10000次,3為>=10001次
➜【性別】:1為男,2為女

※(5).建立【交叉分析表:每個月到星巴克消費次數 vs 零用金】
➜上方【分析】➜【描述統計】➜【交叉表分析,Cross tables】
➜設定【列】➜【次數】
➜設定【欄】➜【零用金】
➜設定【資料格】➜【百分比】➜【欄位】


※(6).【統計檢定】:判斷2個變數是否有關聯
➜已知【類別 vs 類別】:用【卡方檢定(χ² test)】
➜【疑問】:零用金是數值(10000),不是類別,為什麼可以用【卡方檢定?】
➜請說出你的答案?

※(7).建立【交叉分析表:次數 vs 零用金】的【統計檢定】
➜設定【統計資料】➜勾選【卡方檢定】

➜【判別技巧】:若是我們計算出來的【漸近顯著性】值< 0.05,表示【2個變數之間呈現顯著性關聯】

➜☎【結論】:計算結果的【漸近顯著性】值 = 0.013 < 0.05,表示【2個變數之間有顯著關聯】
➜☎【表示】:受訪者到星巴克的【次數高低】,會因為【零用金】而有顯著差異


※(8).如何目測看出【受訪者到星巴克的【次數高低】,會因為【零用金】而有顯著差異】
➜目測:每個月到星巴克較少者(小於3次),主要是零用金較少者(<5000)
➜目測:每個月到星巴克稍多者(4~9次),主要是零用金較多者(>10000)
➜目測:每個月到星巴克最多者(大於10次),主要是零用金較多者(>10000)
➜結論:每個月到星巴克的次數,的確與零用金的高低而有顯著差異


35-5.Final完整的word分析報告

※(1).【成果Demo】:調查【男女】與【運動時間】是否存在顯著關聯?


【請問】:請問【這個交叉分析表,與卡方檢定】有什麼問題?

※(2).☎【非常重要】:【交叉表分析,Cross tables】的功用:
【功用】:探討2個【類別變數】之間的【關聯性】
【範例1】:選舉時,探討【不同地區】對A候選人【是否支持】
【範例2】:選舉時,探討【性別】對甲政黨【是否支持】
【範例3】:行銷研究,探討【教育程度】對【不同品牌】的偏好
【範例4】:行銷研究,探討【喜好不同品牌】對【購買原因】的關聯度

※(3).下載問卷調查資料:調查男女運動時間
※上傳【35-6-調查男女運動時間.sav】,到北科大軟體雲的windows電腦的F:\硬碟

※(4).用北科大軟體雲的SPSS讀入【35-6-調查男女運動時間.sav】檔案
➜【運動時間】:數值(分鐘)
➜【性別】:1為男,2為女

※(5).建立【交叉分析表:運動時間 vs 性別】
➜上方【分析】➜【描述統計】➜【交叉表分析,Cross tables】
➜設定【列】➜【運動時間】
➜設定【欄】➜【性別】
➜設定【資料格】➜【計數】➜【觀察值】

➜【卡方檢定】➜p=0.151 > 0.05,表示2個變數沒有顯著關聯


※(6).【上面的問題】
【問題1】➜【運動時間】被分割成太多的組
【問題2】➜【運動時間】每個組的【期望個數(樣本數)】太少,低於5,是無法適用於卡方檢定的,若是檢定了,p值是不正確的

※(7).【解決方法】:建立1個新欄位【時間分組】
➜【時間分組】:運動時間分成幾類:1為<=30,2為31~60次,3為61~90次,4為91~120次,5為>=120分鐘
➜新增【時間分組】➜上方menu【轉換】➜重新編碼成不同變數
【轉換】➜重新編碼成不同變數,示意圖
➜設定【數值變數】➜【運動時間】
➜設定【輸出變數】➜【時間分組】
設定【數值變數,輸出變數】,示意圖
➜設定【舊值與新值】
➜設定【新值】=【1】,【舊值】=【範圍】➜lowest 到值【30】
設定【新值1 = 小於舊值30】,示意圖
➜設定【新值】=【2】,【舊值】=【範圍】➜【31】~【60】
設定【新值2 = 31~60】,示意圖
➜設定【新值】=【3】,【舊值】=【範圍】➜【61】~【90】
➜設定【新值】=【4】,【舊值】=【範圍】➜【91】~【120】
➜設定【新值】=【5】,【舊值】=【範圍】➜higest 到值【121】
設定【新值5 = 大於舊值121】,示意圖
點按【變更】,才能點按【確定】
點按【變更】,才能點按【確定】,示意圖
結果,已經新增欄位【時間分組】,示意圖

※(8).到【變數視圖】視窗➜【設定時間分組的標籤】:
➜到【變數視圖】➜點按【時間分組】的[...]
➜輸入【值】=1,【標籤】=~30
點按【變更】,才能點按【確定】,示意圖
➜輸入【值】=2,【標籤】=31~60
➜輸入【值】=3,【標籤】=61~90
➜輸入【值】=4,【標籤】=91~120
➜輸入【值】=5,【標籤】=121~
結果,示意圖

※(9).建立【交叉分析表:時間分組 vs 性別】
➜上方【分析】➜【描述統計】➜【交叉表分析,Cross tables】
➜設定【列】➜【時間分組】
➜設定【欄】➜【性別】
➜設定【資料格】➜【計數】➜【觀察值】➜結果:每個類別數量都大於5
結果,示意圖
➜【卡方檢定】➜p=0.0231 < 0.05,表示這2個變數有顯著關聯
➜而且【每個類別的期望個數】都大於5,符合卡方檢定的條件


➜☎【結論】:在短時間的運動(0~30,61~90)女生高於男生,在長時間的運動(31~60,91~120)男生高於女生
➜☎【表示】:【男生的運動時間】普遍較【女生的運動時間】來得長一些

【3-6-相對比分析,比例分析,Ratio】:探討2個類別變數對比(相除)的統計分析,探討2個變數對比的關聯性

※(1).【成果Demo】:【中國大陸2007年城鄉消費額分析】,探討是否不同的城鄉消費有明顯差異?:


※(3).【觀念】:【描述統計Descriptive Statistics】,包括以下5種功能:
第1種【次數分配表,頻數分析,Frequencies】
第2種【描述統計分析,Descriptive Statistics】
第3種【預檢資料,Explore】
第4種【交叉表分析,Cross tables】
第5種【相對比分析,Ratio】

※(4).【相對比分析,Ratio】的幾個常用指標,以比例變數a(=城市消費額/鄉村消費額)為例:
【指標1】:a的【平均數】若較大,表示城鄉差距大
【指標2】:a的【AAD,平均絕對離差】若較大,表示值發散,表示城鄉差距大
【指標3】:a的【COD,離散係數】若較大,表示值發散,表示城鄉差距大
【指標4】:a的【PRD,價格相對微分】若較大,表示值發散,表示城鄉差距大
【指標5】:a的【基於平均數的變異係數】若較大,表示值發散,表示城鄉差距大

※(4).下載問卷調查資料:中國大陸2007年城鄉消費額分析
※上傳【36-1-中國大陸2007年城鄉消費額分析.sav】,到北科大軟體雲的windows電腦的F:\硬碟

※(5).用北科大軟體雲的SPSS讀入【36-1-中國大陸2007年城鄉消費額分析.sav】檔案

※(6).建立【相對比例分析,Ratio】
➜上方【分析】➜【描述統計】➜【比例】
➜設定【分子】➜【City】
➜設定【分母】➜【Country】
➜設定【群組變數】➜【Area】
➜設定【統計資料】➜勾選【平均數,AAD,COD,PRD,基於平均數的變異係數】
設定【比例分析】,示意圖
設定【分子,分母,群組變數】,示意圖


※(7).分析【比例變數a(城市消費額/鄉村消費額)】,分析城鄉消費差距:
➜看【平均數】比較大的地區➜【華南,西北,西南】➜這些地方城鄉消費差距大(貧富不均)
➜看【AAD,COD】比較小的地區➜【東北,華中】➜這些地方城鄉消費差距小(貧富差不多)
➜看【AAD,COD】比較大的地區➜【華東,西南】➜這些地方城鄉消費差距大(貧富不均)
➜說明:東北三省的發展均衡,都是糧倉與工業城市
➜說明:西南(西藏貴州,與成都重慶的發展差異很大)

【3-7-單一樣本t檢定(1個連續數值y)】:探討1個連續變數樣本平均值,與指定檢定值之間是否存在顯著差異

※(1).【成果Demo】:某校【大一新生體重數據】與【5年前大一平均體重65.6】相比,是否有顯著差異?

37-1.word分析報告

☎※(2).【判斷檢定方法的最重要圖表】:

➜根據(x, y)對應的不同格式,可以選擇不同的統計檢定方法:

➜若只有1個連續數值(y),則要選擇【單一樣本t檢定】方法

※(3).問卷調查資料:大一新生體重數

編號 體重
180.3
270.27
374.53
463.81
561.06
660.14
774.32
866.21
966.57
1070.35
1168.39
1278.02
1372.93
1468.22
1570.59
1666.78
1778.32
1865.82
1969.63
2061.05
2148.55
2272.14
2363.69
2461.87
2584.02
2656.63
2767.66
2865.95
2978.6
3068.14
3168.47
3270.11
3360.8
3452.76
3564.77
3668.48
3776.38
3876.17
3964.48
4065.1
4159.62
4256.88
4354.78
4481.68
4563.58
4664.11
4758.11
4873.05
4955.46
5065.76


※(4).用北科大軟體雲的SPSS新增一個新的【SPSS】檔案
➜在【變數視圖】視窗➜建立2個欄位【編號,體重】
建立2個欄位【編號,體重】,示意圖
➜在【資料視圖】視窗➜複製【37-1-大一新生體重數據.csv】的數據,貼上
複製csv數據,示意圖
貼到SPSS,示意圖

※(5).建立【單一樣本t檢定】
➜上方【分析】➜【比較平均數法】➜【單一樣本t檢定】
點選【單一樣本t檢定】,示意圖
➜設定【檢定變數】➜【體重】
➜設定【檢定值】➜【65.6】
➜設定【選項】➜【信賴區間百分比】= 95%
點選【單一樣本t檢定】,示意圖


➜【平均】:67.50似乎比5年前(65.6)還要高一些
➜【但是檢定後發現】:p= 0.095>信賴水準0.05,所以不顯著(符合Ho虛無假設,2個變數沒有差異)

【結論】:現在大一學生的體重與5年前學生體重相比,沒有顯著差別(差不多)

※(6).【單一樣本t檢定】步驟:
➜【單一樣本t檢定】:適用於單一連續數值變數。
➜步驟1:設置2種假設:
◉零假設(𝐻0),又名虛無假設:兩個變數之間獨立(無顯著關聯,無顯著差異)。
◉對立假設(𝐻1):兩個變數之間不獨立(有顯著關聯,有顯著差異)。
➜步驟2:用公式計算t檢定值。
➜步驟3:計算p值:查找對應的p值。
➜步驟4:比較顯著水平:如果p值小於顯著水平(如0.05),則拒絕零假設,認為兩變數之間有顯著關聯。


37-1.word分析報告

※(1).【成果Demo】:【大學生每週運動時間】與【5年前平均70分鐘】相比,是否有今年已經明顯增加?(單尾檢定)?


☎※(2).【判斷檢定方法的最重要圖表】:

➜根據(x, y)對應的不同格式,可以選擇不同的統計檢定方法:

➜若只有1個連續數值(y),則要選擇【單一樣本t檢定】方法

※(3).下載問卷調查資料:大學生每週運動時間
※開啟【37-2-大學生每週運動時間.csv】,複製數據

※(4).用北科大軟體雲的SPSS新增空白檔案,先在【變數視圖】視窗,建立2個欄位
➜【編號】
➜【運動時間】:數值(分鐘)
➜複製貼上csv的數據

※(5).建立【單一樣本t檢定】
➜上方【分析】➜【比較平均數法】➜【單一樣本t檢定】
➜設定【檢定變數】➜【運動時間】
➜設定【檢定值】➜【70】
➜設定【選項】➜【信賴區間百分比】= 95%


※(6).要判斷這是【雙尾檢定,還是單尾檢定?】

➜題目問題的假設:不是問【前後有沒有差異】➜【雙尾檢定】
➜題目問題的假設:而是問【今年有沒有明顯增加】➜【單尾檢定】
➜H0虛無假設/否定假設:μ ≦ 70(小於70成立)
➜H1對立假設:μ >70(大於70成立)

➜右尾檢定:必須把【顯著性(雙尾)】再除以2
➜0.01/2 = 0.005
➜【判斷p值是否<0.05】:0.005<0.05,


➜【平均】:83.87似乎比5年前(70)還要高一些
➜【但是檢定後發現】:p= 0.095<信賴水準0.05,所以有顯著差異(H1對立假設:μ >70(大於70成立))

【結論】:現在大一學生的運動時間與5年前學生相比,明顯增加

※(7).【單一樣本t檢定】步驟:
➜【單一樣本t檢定】:適用於單一連續數值變數。
➜步驟1:設置2種假設:
◉零假設(𝐻0),又名虛無假設:兩個變數之間獨立(無顯著關聯,無顯著差異)。
◉對立假設(𝐻1):兩個變數之間不獨立(有顯著關聯,有顯著差異)。
➜步驟2:用公式計算t檢定值。
➜步驟3:計算p值:查找對應的p值。
➜步驟4:比較顯著水平:如果p值小於顯著水平(如0.05),則拒絕零假設,認為兩變數之間有顯著關聯。

※(1).【成果Demo】:某報紙宣稱【大學生每週飲料花費已經 ≥ 100元】,是否可以否定該宣稱(α < 0.05)?

☎【請問】:這個是【雙尾檢定,還是右尾檢定,還是左尾檢定?】

☎※(2).【判斷檢定方法的最重要圖表】:

➜根據(x, y)對應的不同格式,可以選擇不同的統計檢定方法:

➜若只有1個連續數值(y),則要選擇【單一樣本t檢定】方法

※(3).下載問卷調查資料:大學生每週飲料花費數據
※開啟【37-3-大學生每週飲料花費數據.csv】,

※(4).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗,建立2個欄位
➜【編號】
➜【飲料花費】:數值
➜複製貼上csv的數據

※(5).建立【單一樣本t檢定】
➜上方【分析】➜【比較平均數法】➜【單一樣本t檢定】
➜設定【檢定變數】➜【飲料花費】
➜設定【檢定值】➜【100】
➜設定【選項】➜【信賴區間百分比】= 95%


※(6).要判斷這是【雙尾檢定,還是單尾檢定?】

➜題目問題的假設:是否可以否定該宣稱≧100元➜假設【即是:<100元】
➜H0虛無假設/否定假設:μ ≧ 100(大於等於100成立)
➜H1對立假設:μ <100(小於100成立)

➜左尾檢定:必須把【顯著性(雙尾)】再除以2
➜0.004/2 = 0.002
➜【判斷p值是否<0.05】:0.002<0.05,


➜【平均】:83.23似乎比報紙宣稱(100)還要低很多,很明顯
➜【檢定後發現】:p= 0.02<信賴水準0.05,所以符合對立假設(H1對立假設:μ >100(小於100成立))

【結論】:現在大一學生的每週飲料花費,明顯小於100(報紙宣稱)

※(7).【單一樣本t檢定】步驟:
➜【單一樣本t檢定】:適用於單一連續數值變數。
➜步驟1:設置2種假設:
◉零假設(𝐻0),又名虛無假設:兩個變數之間獨立(無顯著關聯,無顯著差異)。
◉對立假設(𝐻1):兩個變數之間不獨立(有顯著關聯,有顯著差異)。
➜步驟2:用公式計算t檢定值。
➜步驟3:計算p值:查找對應的p值。
➜步驟4:比較顯著水平:如果p值小於顯著水平(如0.05),則拒絕零假設,認為兩變數之間有顯著關聯。

【3-8-獨立樣本t檢定(2類別x vs 連續數值y)】:檢定2個獨立樣本(2個選擇的種類)的總體平均數,是否存在顯著差異?

※(1).【成果Demo】:判定【男女每週飲料花費】,【是否存在差異】?

➜☎【請問】:這樣子的數據,該用什麼【統計檢定】?
➜☎【請問】:這個是【雙尾檢定,還是右尾檢定,還是左尾檢定】?
➜☎【請問】:2個獨立樣本的總體平均數比較,是什麼意思?


☎※(2).【判斷檢定方法的最重要圖表】:

➜根據(x, y)對應的不同格式,可以選擇不同的統計檢定方法:

➜若只有1個連續數值(y),則要選擇【單一樣本t檢定】方法

※(3).下載問卷調查資料:男女之飲料花費
※開啟【38-1-男女之飲料花費.csv】,

※(4).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗,建立2個欄位
➜【編號】
➜【飲料花費】:數值
➜【性別】:數值➜在【值】欄位建立標籤(1:男,2:女)
➜複製貼上csv的數據

※(5).建立【獨立樣本t檢定】
➜上方【分析】➜【比較平均數法】➜【獨立樣本t檢定】
【獨立樣本t檢定】,示意圖
➜設定【檢定變數】➜【飲料花費】
➜設定【分組變數】➜【性別】
➜設定【選項】➜【信賴區間百分比】= 95%
設定【檢定變數/分組變數】,示意圖
➜點按【定義群組】:
➜設定【群組1】➜1
➜設定【群組2】➜2
設定【定義群組】,示意圖


※(6).要判斷這是【雙尾檢定,還是單尾檢定?】
➜題目問題的假設:是否男女飲料花費,存在顯著差異(明顯不一樣?)
➜H0虛無假設/否定假設:μ1 = μ1(男女一樣)
➜H1對立假設:μ1 ≠ μ2(男女不一樣)
➜雙尾檢定


※(7).【注意】:上面的檢定表,【要經過2階段檢定】
※(A-第1階段):先看【變異數等式的Levene檢定】
➜判斷【顯著性是否<0.05】:0.752>0.05➜➜表示接受【2個母體變異數相等的假設】
➜【平均】:男生每週飲料花費93,女生花費77,差異頗大




※(B-第2階段):再看【平均值等式的t檢定】
➜判斷【顯著性是否<0.05】:0.190>0.05➜➜表示接受【虛無假設H0,男生女生飲料花費:相同】➜第1列的值
➜【解釋:為什麼選擇0.190,而不是選0.206?】:這是因為階段1,已經證明,必須選擇【相等變異數】
➜【平均】:男生每週飲料花費93,女生花費77,雖然差異頗大
➜【但經過檢定後發現】:p= 0.19>信賴水準0.05,所以符合虛無假設(男女每週飲料花費,明顯一樣,沒有明顯差異)


【結論】:現在男女的每週飲料花費,明顯一樣,沒有差異

※(7).【獨立樣本t檢定】步驟:
➜【獨立樣本t檢定】:適用於2個類別母體的比較一個連續數值變數。
➜步驟1:設置2種假設:
◉零假設(𝐻0),又名虛無假設:兩個變數之間獨立(無顯著關聯,無顯著差異)。
◉對立假設(𝐻1):兩個變數之間不獨立(有顯著關聯,有顯著差異)。
➜步驟2:用公式計算t檢定值。
➜步驟3:計算p值:查找對應的p值。
➜步驟4:必須經過2階段檢定:
◉先看【變異數等式的Levene檢定】:若是【顯著性是否>0.05】採用【相等變異數】,否則採用【不相等變異數】
◉再看【平均值等式的t檢定】:根據階段1的【相等變異數】/或是【不相等變異數】,來對應t檢定的【顯著性值】,根據此【顯著性值】是否>0.05,來判別是否符合HO虛無假設,或 H1對立假設,
如果p值小於顯著水平(如0.05),則拒絕零假設,認為兩變數之間有顯著關聯。

※(1).【成果Demo】:判定【男女每週運動時間】,【男生是否大過女生】?

➜☎【請問】:這樣子的數據,該用什麼【統計檢定】?
➜☎【請問】:這個是【雙尾檢定,還是右尾檢定,還是左尾檢定】?
➜☎【請問】:2個獨立樣本的總體平均數比較,是什麼意思?


☎※(2).【判斷檢定方法的最重要圖表】:

➜根據(x, y)對應的不同格式,可以選擇不同的統計檢定方法:

➜若只有1個連續數值(y),則要選擇【單一樣本t檢定】方法

※(3).下載問卷調查資料:男女每週之運動時間比較
※開啟【38-2-男女每週之運動時間比較.csv】,

※(4).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗,建立2個欄位
➜【編號】
➜【性別】:數值➜在【值】欄位建立標籤(1:男,2:女)
➜【運動時間】:數值
➜複製貼上csv的數據

※(5).建立【單一樣本t檢定】
➜上方【分析】➜【比較平均數法】➜【獨立樣本t檢定】
➜設定【檢定變數】➜【運動時間】
➜設定【分組變數】➜【性別】
➜設定【選項】➜【信賴區間百分比】= 95%
➜點按【定義群組】:
➜設定【群組1】➜1
➜設定【群組2】➜2


※(6).要判斷這是【雙尾檢定,還是單尾(左/右尾)檢定?】
➜題目問題的假設:判定【男女每週運動時間】,【男生是否大過女生】?
➜H0虛無假設/否定假設:μ1 ≦ μ2(男小於等於女)
➜H1對立假設:μ1 > μ2(男大於女)
➜單尾檢定(右尾)

※(7).【注意】:上面的檢定表,【要經過2階段檢定】
※(A-第1階段):先看【變異數等式的Levene檢定】
➜判斷【顯著性是否<0.05】:0.335>0.05➜➜表示接受【2個母體變異數相等的假設】 ➜第1列的值
➜【平均】:男生每週59,女生56,差異不大



※(B-第2階段):再看【平均值等式的t檢定】
➜判斷【顯著性是否<0.05】:0.116>0.05➜➜表示接受【虛無假設H0,男生女生飲料花費:相同】
➜【解釋:為什麼選擇0.116,而不是選0.117?】:這是因為階段1,已經證明,必須選擇【相等變異數】
➜【平均】:男生每週時間59,女生56,差異不大
➜【經過單尾檢定後發現】:p= 0.16/2 = 0.08>信賴水準0.05,所以符合虛無假設(μ1 ≦ μ2(男運動時間小於等於女)


【結論】:現在男生的每週運動時間,沒有比女生多(小於等於女生)

※(7).【獨立樣本t檢定】步驟:
➜【獨立樣本t檢定】:適用於2個類別母體的比較一個連續數值變數。
➜步驟1:設置2種假設:
◉零假設(𝐻0),又名虛無假設:兩個變數之間獨立(無顯著關聯,無顯著差異)。
◉對立假設(𝐻1):兩個變數之間不獨立(有顯著關聯,有顯著差異)。
➜步驟2:用公式計算t檢定值。
➜步驟3:計算p值:查找對應的p值。
➜步驟4:必須經過2階段檢定:
◉先看【變異數等式的Levene檢定】:若是【顯著性是否>0.05】採用【相等變異數】,否則採用【不相等變異數】
◉再看【平均值等式的t檢定】:根據階段1的【相等變異數】/或是【不相等變異數】,來對應t檢定的【顯著性值】,根據此【顯著性值】是否>0.05,來判別是否符合HO虛無假設,或 H1對立假設,
如果p值小於顯著水平(如0.05),則拒絕零假設,認為兩變數之間有顯著關聯。

※(1).【成果Demo】:判定【台北/雲林地區所得比較】,是否【台北所得高過於雲林】?

➜☎【請問】:這樣子的數據,該用什麼【統計檢定】?
➜☎【請問】:這個是【雙尾檢定,還是右尾檢定,還是左尾檢定】?
➜☎【請問】:2個獨立樣本的總體平均數比較,是什麼意思?


☎※(2).【判斷檢定方法的最重要圖表】:

➜根據(x, y)對應的不同格式,可以選擇不同的統計檢定方法:

➜若只有1個連續數值(y),則要選擇【單一樣本t檢定】方法

※(3).下載問卷調查資料:台北雲林地區所得比較
※開啟【38-3-台北雲林地區所得比較.csv】,

※(4).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗,建立2個欄位
➜【編號】
➜【地區】:數值➜在【值】欄位建立標籤(1:台北,2:雲林)
➜【所得】:數值
➜複製貼上csv的數據

※(5).建立【獨立樣本t檢定】
➜上方【分析】➜【比較平均數法】➜【獨立樣本t檢定】
➜設定【檢定變數】➜【所得】
➜設定【分組變數】➜【地區】
➜設定【選項】➜【信賴區間百分比】= 95%
➜點按【定義群組】:
➜設定【群組1】➜1
➜設定【群組2】➜2


※(6).要判斷這是【雙尾檢定,還是單尾(左/右尾)檢定?】
➜題目問題的假設:判定【台北/雲林地區所得比較】,是否【台北所得高過於雲林】?
➜【注意】:H0虛無假設/否定假設:是這句話的相反(台北所得高過於雲林)➜相反➜台北所得低於雲林

➜H0虛無假設/否定假設:μ1 ≦ μ2(台北所得小於等於雲林)
➜H1對立假設:μ1 > μ2(台北所得大於雲林)
➜單尾檢定(右尾)

※(7).【注意】:上面的檢定表,【要經過2階段檢定】
※(A-第1階段):先看【變異數等式的Levene檢定】
➜判斷【顯著性是否<0.05】:0.012<0.05➜➜表示接受對立假設【2個母體變異數不相等的假設】➜第2列的值



※(B-第2階段):再看【平均值等式的t檢定】
➜判斷【顯著性是否<0.05】:0.01/2 = 0.005<0.05➜➜表示接受【對立假設H1,台北所得大於雲林】
➜【解釋:為什麼選擇0.01,而不是選0.009?】:這是因為階段1,已經證明,必須選擇【不相等變異數】
➜【平均】:台北所得67882,雲林37290,差異很大
➜【經過單尾檢定後發現】:p= 0.01/2 = 0.0058<信賴水準0.05,所以符合對立假設:μ1 > μ2(台北所得大於雲林)


【結論】:台北所得,明顯高於雲林

※(7).【獨立樣本t檢定】步驟:
➜【獨立樣本t檢定】:適用於2個類別母體的比較一個連續數值變數。
➜步驟1:設置2種假設:
◉零假設(𝐻0),又名虛無假設:兩個變數之間獨立(無顯著關聯,無顯著差異)。
◉對立假設(𝐻1):兩個變數之間不獨立(有顯著關聯,有顯著差異)。
➜步驟2:用公式計算t檢定值。
➜步驟3:計算p值:查找對應的p值。
➜步驟4:必須經過2階段檢定:
◉先看【變異數等式的Levene檢定】:若是【顯著性是否>0.05】採用【相等變異數】,否則採用【不相等變異數】
◉再看【平均值等式的t檢定】:根據階段1的【相等變異數】/或是【不相等變異數】,來對應t檢定的【顯著性值】,根據此【顯著性值】是否>0.05,來判別是否符合HO虛無假設,或 H1對立假設,
如果p值小於顯著水平(如0.05),則拒絕零假設,認為兩變數之間有顯著關聯。

※(1).【成果Demo】:判定【男女對於洗面乳選購的在意點】,是否【男女會有明顯差異】?


➜☎【請問1】:探討上面問卷的2個變數【性別】vs【購買洗面乳考慮因素(選項有5個)】,它們的關係是【類別vs類別】,還是【類別vs連續數值】?
➜☎【請問2】:探討這樣子【性別】vs【購買洗面乳考慮因素(選項有5個)】彼此關聯,該用什麼【統計檢定】?
➜☎【請問3】:這個是【雙尾檢定,還是右尾檢定,還是左尾檢定】?


☎※(2).【判斷檢定方法的最重要圖表】:

➜根據(x, y)對應的不同格式,可以選擇不同的統計檢定方法:

➜若只有1個連續數值(y),則要選擇【單一樣本t檢定】方法
【重要觀念】:問卷表單的5點量表,看似是【類別,5個種類】,但是當我們輸入到excel後,它是用1~5輸入,最後會計算【平均值】
【重要觀念】:所以5點量表的【欄位】,是【數值】欄位,不是【類別】欄位

※(3).建立Google問卷調查表單:男女對於洗面乳選購的在意點調查
【特別注意】:若是問卷表單的欄位要用數值儲存,則選擇題,盡量用【5點量表】/【2點量表】來製作,欄位儲存的值才會是1,2,3...
※輸入3筆數據
回覆後建立的Google試算表檔案:38-4.-男女對於洗面乳選購的在意點調查 (回覆)
➜【檔案】➜【下載】➜【男女對於洗面乳選購的在意點調查.xlsx】
➜把【時間戳記】➜修改成【編號】➜這個欄位,滑鼠右鍵➜修改【儲存格格式】➜改成【數值】➜小數點0位
➜修改編號的值,輸入【1,2,3,.....】
修改後的excel數據畫面,示意圖

※(4).下載問卷調查的完整資料:男女對於洗面乳選購的在意點調查
※開啟【38-4.-男女對於洗面乳選購的在意點調查.csv】,
➜複製csv的數據,貼到excel檔案
修改後的excel數據畫面,示意圖

※(5).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗,建立2個欄位
➜【編號】
➜【抗痘】:數值
➜【去油】:數值
➜【美白】:數值
➜【緊緻毛孔】:數值
➜【卸妝】:數值
➜【性別】:數值➜在【值】欄位建立標籤(1:男,2:女)
➜將excel的全部數據,複製貼到SPSS
示意圖1示意圖1

※(6).建立【單一樣本t檢定】
➜上方【分析】➜【比較平均數法】➜【獨立樣本t檢定】
➜設定【檢定變數】➜【抗痘,去油,美白,保濕,保濕,緊緻毛孔,卸妝】
➜設定【分組變數】➜【性別】
➜設定【選項】➜【信賴區間百分比】= 95%
➜點按【定義群組】:
➜設定【群組1】➜1
➜設定【群組2】➜2
示意圖1

※(7).要判斷這是【雙尾檢定,還是單尾(左/右尾)檢定?】
➜題目問題的假設:判定【男女對於洗面乳選購的在意點】,是否【男女會有明顯差異】?
➜【注意】:H0虛無假設/否定假設:是這句話的相反(男女會有明顯差異)➜相反➜男女沒有明顯差異

➜H0虛無假設/否定假設:μ1 = μ2(男女沒有明顯差異)
➜H1對立假設:μ1 ≠ μ2(男女會有明顯差異)
➜雙尾檢定



※(7).【注意】:上面的檢定表,【要經過2階段檢定】
※(A-第1階段):先看【變異數等式的Levene檢定】
➜判斷【顯著性是否<0.05】:全部的【顯著性值】都>0.05➜➜表示接受虛無假設【2個母體變異數相等的假設】➜第1列的值



※(B-第2階段):再看【平均值等式的t檢定】
➜判斷【顯著性是否<0.05】:
➜【抗痘,去油】的【顯著性值】都>0.05➜表示接受【虛無假設H0】➜【男女的選擇,沒有明顯差異】
➜【美白,保濕,保濕,緊緻毛孔,卸妝】的【顯著性值】都<0.05➜表示接受【對立假設H1】➜【男女的選擇,有明顯差異】
➜【注意,要選擇第1列的顯著性值】:這是因為階段1,已經證明,必須選擇【相等變異數】



➜【結論1】:男女在選購洗面乳時,男女在考慮【抗痘,去油】方面,【沒有明顯差異】
➜【結論2】:男女在選購洗面乳時,男女在考慮【美白,保濕,保濕,緊緻毛孔,卸妝】方面,【有明顯差異】
➜【結論3】:若是看平均數字,男女在考慮【美白,保濕,保濕,緊緻毛孔,卸妝】方面,【明顯是女生比較會考慮,男生比較不在意】

※(1).【成果Demo】:判定【男女對於洗面乳選購的在意點】,是否【女生是不是會比男生來得明顯重視?】(2)(重要)


請開啟【上一題的Google問卷表單】,要做修改
➜☎【請問1】:上述Google問卷的選項若要儲存【數字1,2,3...】,除了採用【5點量表】外,還有什麼方法?
➜☎【請問2】:上述Google問卷的同時有很多一樣選項的題目,首選是【單選方格】,但是它沒有支援【5點量表】,只能用【文字選擇題】來做,如何才能儲存數字欄位?
➜☎【請問3】:上述Google問卷的【性別】,若是用【5點量表】來做,有點怪怪的,可以用【選擇題/單選題】來做嗎?
➜☎【請問4】:難道【5點量表】是問卷調查唯一的方法了嗎?
➜☎【請問5】:這個是【雙尾檢定,還是右尾檢定,還是左尾檢定】?


※(2).【修改Google表單】:找出,又可以取代【5點量表】又可以【儲存數字】的做法:
建立可以取代【5點量表】又可以【儲存數字】的Google問卷表單
➜【方法1】:使用【選擇題】,其中的項目用【1,2,3...】
➜【方法2】:使用【單選方格(5點量表)】,其中的項目用【1,2,3...】

※輸入3筆數據
回覆後建立的Google試算表檔案:發現欄位名稱過長
➜【檔案】➜【下載】➜
➜把【時間戳記】➜修改成【編號】➜這個欄位,滑鼠右鍵➜修改【儲存格格式】➜改成【數值】➜小數點0位
➜把其它欄位修改成簡短欄位名稱:【抗痘,去油,美白,保濕,保濕,緊緻毛孔,卸妝】
➜修改編號的值,輸入【1,2,3,.....】
修改後的excel數據畫面,示意圖

※(4).下載問卷調查的完整資料:男女對於洗面乳選購的在意點調查
※開啟【38-4-男女對於洗面乳選購的在意點調查.csv】,
➜複製csv的數據,貼到excel檔案
修改後的excel數據畫面,示意圖

※(5).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗,建立2個欄位
➜【編號】
➜【抗痘】:數值
➜【去油】:數值
➜【美白】:數值
➜【緊緻毛孔】:數值
➜【卸妝】:數值
➜【性別】:數值➜在【值】欄位建立標籤(1:男,2:女)
➜將excel的全部數據,複製貼到SPSS
示意圖1示意圖1

※(6).建立【獨立樣本t檢定】
➜上方【分析】➜【比較平均數法】➜【獨立樣本t檢定】
➜設定【檢定變數】➜【抗痘,去油,美白,保濕,保濕,緊緻毛孔,卸妝】
➜設定【分組變數】➜【性別】
➜設定【選項】➜【信賴區間百分比】= 95%
➜點按【定義群組】:
➜設定【群組1】➜1
➜設定【群組2】➜2
示意圖1

※(7).要判斷這是【雙尾檢定,還是單尾(左/右尾)檢定?】
➜題目問題的假設:判定【男女對於洗面乳選購的在意點】,是否【女生是不是會比男生來得明顯重視?】
➜【注意】:H0虛無假設/否定假設:是這句話的相反(女生是不是會比男生來得明顯重視?)➜相反➜女生沒有比男生明顯重視這些洗面乳屬性

➜H0虛無假設/否定假設:μ1 ≧ μ2(女生μ2沒有比男生μ1明顯重視這些洗面乳屬性,μ2<μ1,男生重視值≧女生)
➜H1對立假設:μ1 < μ2(男生重視值<女生)
➜【注意】:這是【單尾檢定】(左尾檢定)



※(7).【注意】:上面的檢定表,【要經過2階段檢定】
※(A-第1階段):先看【變異數等式的Levene檢定】
➜判斷【顯著性是否<0.05】:全部的【顯著性值】都>0.05➜➜表示接受虛無假設【2個母體變異數相等的假設】➜第1列的值



※(B-第2階段):再看【平均值等式的t檢定】
二,獨立樣本t檢定,判斷過程:
1.這是【單尾檢定】➜所以要把【顯著性值】/2
2.判斷方法:【顯著性是否<0.05】:
3.判斷【抗痘】的【顯著性值】0.523/2 =0.2616>0.05
➜表示接受【虛無假設H0】➜【男生重視值≧女生】
4.判斷【去油】的【顯著性值】0.096/2 = 0.048<0.05
➜表示接受【獨立假設H1】➜【男生重視值<女生】。
5.但【去油】屬性,它的檢定顯著性值,在0.05左右,在顯著/不顯著邊緣。
6.判斷【美白,保濕,保濕,緊緻毛孔,卸妝】的【顯著性值】都<0.05
➜表示接受【對立假設H1】➜【男生重視值<女生】
➜【注意,要選擇第1列的顯著性值】:這是因為階段1,已經證明,必須選擇【相等變異數】



三,結論:
1.【結論1】:在選購洗面乳時,男生比較在意的點是【抗痘】
2.【結論2】:在選購洗面乳時,女生比較在意的點是【去油,美白,保濕,保濕,緊緻毛孔,卸妝】。
3.【結論3】:【去油】屬性,它的檢定顯著性值,在0.05左右,在顯著/不顯著邊緣。
4.【結論3】:若是看平均數字,女生在考慮【美白,保濕,保濕,緊緻毛孔,卸妝】的分數比較高,【所以:明顯是女生比較會考慮,男生比較不在意】
5.【結論4】:若是看平均數字,男生在考慮【抗痘,去油】的分數比較高,【所以:明顯是男生比較會考慮所買的洗面乳能否『抗痘,去油』】



※四,【發現問題】:數據太雜亂,無法精簡,一目了然地描述
➜在撰寫報告時,若只是參考SPSS的輸出表格,會因為參數太多,而很難一目了然地說明數據
➜所以一般會把【SPSS表格➜貼到Excel修改,排序,彙整一個精簡表格➜貼到Word寫報告】

※(1).【成果Demo】:把上述【男女對於洗面乳選購的檢定】➜撰寫分析報告【SPSS➜Excel➜Word】(3)



【下載Excel成果檔案】
【下載Word分析報告檔案】




※【上面是成果報告】,【下面是實際的做法與步驟】



※(2).先建立【觀測值摘要】
➜【原因】:因為我們要排序,還要分組分群分析比較,所以首選【觀測值摘要】
➜SPSS開啟上1個資料檔案➜上方【分析】➜【報告】➜【觀測值摘要】
➜設定【變數】➜【抗痘,去油,美白,保濕,保濕,緊緻毛孔,卸妝】
➜設定【分組清單】➜【性別】
➜設定【統計資料】➜選【平均數】
➜取消勾選【顯示觀察值】
設定參數,示意圖


※(3).將SPSS【觀察值摘要】表格【複製】到【Excel】
➜在表格➜【滑鼠右鍵】➜【複製】
➜貼到Excel去編輯每1個表格
➜複製➜【A3:H6】
【貼表格到Excel編輯】,示意圖
➜到【B9】➜【選擇性貼上/轉置(T)】
【選擇性貼上/轉置(T)】,示意圖

➜到【A9】➜輸入【編號】➜新增編號1,2,3,4....7


※(4).【計算排名】
➜到【F9】➜輸入【排名】
➜到【F10】➜輸入公式【=RANK(E10,$E$10:E$16)】


※(5).到SPSS【顯示獨立樣本t檢定表格】
➜在表格➜【滑鼠右鍵】➜【複製】
➜貼到Excel➜【到新的工作表】➜到【B1】➜貼上
【貼表格到Excel,並刪除某些欄位列】,示意圖
➜刪除【第I欄位以後各個欄位】
➜刪除【第4列,第1,第2列】
➜刪除【G欄位:自由度】
【刪除後】,示意圖

➜輸入儲存格文字【編號,屬性,變異數檢定】➜
示意圖1

※(6).【處理B欄空格】
➜選取【B2:B13】➜【複製】
➜點按【B3】➜【選擇性貼上】➜【略過空格】
選取【B2:B13】,示意圖1
【選擇性貼上】➜【略過空格】,示意圖1
【成果】,示意圖

※(7).【處理F欄,E欄的空格】
➜按照上述的做法,相同做法
【成果】,示意圖

※(8).【刪除『變異數檢定』欄位,全部是『不採用相等變異數』的列】
➜原因:根據判斷【顯著性是否<0.05】:全部的【顯著性值】都>0.05➜➜表示接受虛無假設【2個母體變異數相等的假設】➜第1列的值
【刪除多列】,示意圖
【成果】,示意圖

※(9).複製【G欄】到【第1個工作表『觀察值摘要』的最後2個欄位】
➜修改【最後1個欄位:H欄】的【標題】➜【顯著性(單尾)】
【複製G欄】,示意圖
【成果】,示意圖

※(10).在【H10】➜輸入【=G10/2】➜公式作用到【H10~H16】
➜複製【H10~H16】➜【原地】➜選擇性貼上➜【值】
【先複製,再原地選擇性貼上:值】,示意圖
【結果】,示意圖

※(11).刪除【G欄】(顯著性(雙尾)
【結果】,示意圖

※(12).在最後1個欄位【H欄位】➜輸入【<α】(判斷是否符合p<0.05)
➜在【H10】➜輸入【=IF(G10<0.05,"*", "")】➜公式套用到【H10~H16】
【公式套用到相關欄位,再原地選擇性貼上:值】,示意圖

※(13).在【B17】➜輸入【樣本數】
➜在【C17~E17】➜輸入【46,104,150】
➜表格加上【內外框線】

【下載Excel成果檔案】

※(14).將表格複製貼到到【Word】➜寫成【分析報告】
【下載Word分析報告檔案】

※(1).【成果Demo】:判定【東京的1月份均溫,在90年代前,和90年代後】,【是否存在差異】?

➜☎【請問】:這個分析題目的2個變數(x,y),分別是什麼?
➜☎【請問】:這樣子的數據,該用什麼【統計檢定】?
➜☎【請問】:這個是【雙尾檢定,還是右尾檢定,還是左尾檢定】?


☎※(2).【判斷檢定方法的最重要圖表】:

➜根據(x, y)對應的不同格式,可以選擇不同的統計檢定方法:

➜若只有1個連續數值(y),則要選擇【單一樣本t檢定】方法

※(3).下載問卷調查資料:東京1月份歷史溫度
※開啟【38-7-東京1月份歷史溫度.csv】,

※(4).把【csv】格式,儲存成【excel】格式
➜新增欄位【90年代前後】
➜在【C2】➜輸入:=IF(A2<1990, 1, 2)
新增欄位【90年代前後】,示意圖

※(5).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗,建立3個欄位
➜【年份】:數值
➜【一月份均溫】:數值(注意:欄位變數名稱不可以用數字開頭,例如:1月份均溫)
➜【九十年代前後】:數值➜(注意:欄位變數名稱不可以用數字開頭,例如:90年代前後)
➜複製貼上excel的數據

※(6).建立【單一樣本t檢定】
➜上方【分析】➜【比較平均數法】➜【獨立樣本t檢定】
➜設定【檢定變數】➜【一月份均溫】
➜設定【分組變數】➜【九十年代前後】
➜設定【選項】➜【信賴區間百分比】= 95%
➜點按【定義群組】:
➜設定【群組1】➜1
➜設定【群組2】➜2


※(6).要判斷這是【雙尾檢定,還是單尾檢定?】
➜題目問題的假設:判定【東京的1月份均溫,在90年代前,和90年代後】,【是否存在差異】?
➜H0虛無假設/否定假設:μ1 = μ1(90年代前後一樣)
➜H1對立假設:μ1 ≠ μ2(90年代前後不一樣)
➜雙尾檢定


※(7).【注意】:上面的檢定表,【要經過2階段檢定】
※(A-第1階段):先看【變異數等式的Levene檢定】
➜判斷【顯著性是否<0.05】:0.438>0.05➜➜表示接受【2個母體變異數相等的假設】



※(B-第2階段):再看【平均值等式的t檢定】
➜判斷【顯著性是否<0.05】:0.02<0.05➜➜表示接受【對立假設H1,90年代前後不一樣】
➜【平均】:90年代前是-4.58,90年代後是-3.2,
➜【經過檢定後發現】:p= 0.02<信賴水準0.05,所以符合對立假設(90年代前後,明顯不一樣,有明顯差異)



➜【結論1】:東京的1月份均溫,90年代前後,有明顯差異
➜【結論2】:東京的1月份均溫,90年代前較低,90年代後較高
➜【注意】:這題的正確做法,應該是下一章的【成對樣本t檢定】,因為【x變數若是相關,相依的】,例如【同一物體的前後測試,x變數在同一物體上同時測試...】,都是屬於【配對樣本t檢定】

【3-9-成對樣本t檢定,配對樣本t檢定(彼此有相關的類別x vs 連續數值y)】:檢定2個獨立樣本(2個選擇的種類)的總體平均數,是否存在顯著差異?

※(1).【成果Demo】:【比較2廠牌輪胎的磨損,車子左邊用正欣輪胎,右邊用見大輪胎】,【正欣輪胎是否比見大磨損大】?

➜☎【請問】:這個分析題目的2個變數(x,y),分別是什麼?
➜☎【請問】:這樣子的數據,該用什麼【統計檢定】?
➜☎【請問】:這個是【雙尾檢定,還是右尾檢定,還是左尾檢定】?


☎※(2).【判斷檢定方法的最重要圖表】:

➜根據(x, y)對應的不同格式,可以選擇不同的統計檢定方法:

➜【判別】:這是【2個廠牌 vs 輪胎磨損數據】➜數據格式是【類別 vs 數值】➜原本應該是【獨立樣本t檢定】
➜【關鍵判別】:但是因為測試磨損時,是在【同一輛車】的左邊右邊輪胎測試廠牌效果,所以【2個廠牌類別】的測試【不是獨立環境】的,而是【相關,相依環境】的,所以不能夠用【獨立樣本t檢定】
➜【正確檢定方法】:成對樣本t檢定,配對樣本t檢定(彼此有相關的類別x vs 連續數值y)
➜【注意】:如果【x變數若是相關,相依的】,例如【同一物體的前後測試,x變數在同一物體上同時測試...】,都是屬於【配對樣本t檢定】


※(3).下載問卷調查資料:輪胎磨損數據
※開啟【39-1-輪胎磨損.csv】

※(4).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗,建立2個欄位
➜【正欣】:數值
➜【見大】:數值
➜複製貼上csv的數據

※(5).建立【單一樣本t檢定】
➜上方【分析】➜【比較平均數法】➜【成對樣本t檢定】
【獨立樣本t檢定】,示意圖
➜設定【配對變數】➜【正欣,見大】
➜設定【選項】➜【信賴區間百分比】= 95%
設定【配對變數】,示意圖


※(6).要判斷這是【雙尾檢定,還是單尾檢定?】
➜題目問題的假設:【正欣輪胎是否比見大磨損大】?
➜H0虛無假設/否定假設:μ1 ≦ μ2(正欣輪胎磨損≦ 見大)
➜H1對立假設:μ1 > μ2(正欣輪胎磨損>見大)
➜單尾檢定



※(7).看【t檢定的顯著性值,注意:是單尾檢定,要/2】
➜判斷【顯著性是否<0.05】:0.061/2 = 0.0305<0.05➜表示接受【對立假設H1,正欣輪胎磨損>見大】
➜【平均】:正欣輪胎磨損96.0,見大87.43,差異頗大
➜【經過檢定後發現】:p= 0.0305<信賴水準0.05,所以符合對立假設(正欣輪胎磨損>見大,明顯差異)



※(8).【結論】:正欣輪胎磨損>見大,明顯有差異
➜【注意】:如果【x變數若是相關,相依的】,例如【同一物體的前後測試,x變數在同一物體上同時測試...】,都是屬於【配對樣本t檢定】

※(1).【成果Demo】:【無瞎米打字法,能夠訓練10位同學,前後進步多40個字嗎】?
➜【訓練前,訓練後】數據如下:

➜☎【請問】:這個分析題目的2個變數(x,y),分別是什麼?
➜☎【請問】:這樣子的數據,該用什麼【統計檢定】?
➜☎【請問】:這個是【雙尾檢定,還是右尾檢定,還是左尾檢定】?


☎※(2).【判斷檢定方法的最重要圖表】:

➜根據(x, y)對應的不同格式,可以選擇不同的統計檢定方法:

➜【判別】:這是【前後2次打字 vs 打字數】➜數據格式是【類別 vs 數值】➜原本應該是【獨立樣本t檢定】
➜【關鍵判別】:但是因為測試磨損時,是在【同一個人】的前後測試,所以【2次】的測試【不是獨立環境】的,而是【相關,相依環境】的,所以不能夠用【獨立樣本t檢定】
➜【正確檢定方法】:成對樣本t檢定,配對樣本t檢定(彼此有相關的類別x vs 連續數值y)
➜【注意】:如果【x變數若是相關,相依的】,例如【同一物體的前後測試,x變數在同一物體上同時測試...】,都是屬於【配對樣本t檢定】


※(3).下載問卷調查資料:打字訓練前後數據
※開啟【39-2-打字訓練.csv】
➜H0虛無假設/否定假設:μ1 ≧ (μ2-40)(後來沒有超過40字)

※(4).【儲存成Excel】格式
➜新增欄位【訓練後-40】
➜【原因】:H0虛無假設/否定假設:μ1 ≧ (μ2-40)(後來沒有超過40字)



※(5).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗,建立2個欄位
➜【訓練前】:數值
➜【訓練後】:數值
➜【訓練後減40】:數值(SPSS不可以用特殊符號當欄位名稱,例如:-,所以不可以用【訓練後-40】
➜複製貼上csv的數據
【數據】,示意圖

※(6).建立【成對樣本t檢定】
➜上方【分析】➜【比較平均數法】➜【成對樣本t檢定】
➜設定【配對變數】➜【訓練前,訓練後減40】
➜設定【選項】➜【信賴區間百分比】= 95%
設定【配對變數】,示意圖


※(7).要判斷這是【雙尾檢定,還是單尾檢定?】
➜題目問題的假設:【前後進步多40個字嗎】?
➜H0虛無假設/否定假設:μ1 ≧ (μ2-40)(後來沒有超過40字)
➜H1對立假設:μ1 < (μ2-40)(後來有超過40字)
➜單尾檢定



※(8).看【t檢定的顯著性值,注意:是單尾檢定,要/2】
➜判斷【顯著性是否<0.05】:0.598/2 = 0.299>0.05➜表示接受【虛無假設H1,後來沒有超過40字】
➜【平均】:訓練前17,(訓練後-40)為19,有差異
➜【經過檢定後發現】:p= 0.0305<信賴水準0.05,所以符合虛無假設H1,後來沒有超過40字


※(9).【結論】:同一批學生接受無瞎米訓練,結果訓練後,打字後來無法超過40字
➜【注意】:如果【x變數若是相關,相依的】,例如【同一物體的前後測試,x變數在同一物體上同時測試...】,都是屬於【配對樣本t檢定】

【3-10-單因子變異數分析,ANOVA】:檢驗多組(n>2)母體平均數是否相等(x類別>=3 vs 連續數值y)

※(1).【成果Demo】:【在報紙投放不同方式的廣告,比較回應人數,是否有差異】?
➜【廣告種類】➜有4種廣告➜【全版,半版,1/4版,小廣告】

➜☎【請問】:這個分析題目的多個變數關係(x,y),分別是什麼?
➜☎【請問】:這樣子的數據,該用什麼【統計檢定】?
➜☎【請問】:這個是【雙尾檢定,還是右尾檢定,還是左尾檢定】?


☎※(2).【判斷檢定方法的最重要圖表】:

➜根據(x, y)對應的不同格式,可以選擇不同的統計檢定方法:

➜【比較1】:【獨立樣本t檢定】:針對2組資料,來比較這2組平均數的差異
➜【比較2】:【單因子變異數分析】:針對3組(或以上)資料,來比較這3組(或以上)平均數的差異


※(3).下載問卷調查資料:廣告效果數據
※開啟【310-1-廣告效果.csv】
➜【廣告種類】➜有4種廣告➜【全版,半版,1/4版,小廣告】

※(4).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗
➜建立2個欄位:
➜【廣告種類】:數值
➜【回應人數】:數值
➜在【廣告種類】的【值】➜輸入4種標籤:【1全版,2半版,3(1/4版),4小廣告】
設定【4種標籤】,示意圖
➜複製貼上csv的數據
貼上【數據】,示意圖

※(5).建立【單因子變異數分析】
➜上方【分析】➜【比較平均數法】➜【單因數變異數分析】
【獨立樣本t檢定】,示意圖
➜設定【依變數清單】➜【回應人數】
➜設定【因子】➜【廣告種類】➜(只有一個因子,所以稱呼為【單因子】)
➜設定【選項】➜【統計量】➜勾選【描述統計】
設定【參數】,示意圖


※(6).要判斷這是【雙尾檢定,還是單尾檢定?】
➜【注意1】:【單因子變異數分析(ANOVA)】通常使用【雙尾】檢定。不考慮【單尾】檢定
➜【注意2】:【獨立樣本t檢定】通常使用【雙尾】檢定。不考慮【單尾】檢定
➜雙尾檢定



※(7).看【顯著性值】
➜判斷【顯著性是否<0.05】:0.003<0.05➜表示接受【對立假設H1,4種方式的投放廣告,回應人數明顯不同,廣告效果不同】
➜【平均值】:【1173,1083,724,733】,差異頗大
➜【經過檢定後發現】:p= 0.003<信賴水準0.05,所以符合對立假設(4種方式的投放廣告,回應人數明顯不同,廣告效果不同)



※(8).【結論】:4種方式的投放廣告,回應人數明顯不同,廣告效果不同

※(1).【成果Demo】:【大學生每月刷卡金額,是否與零用金來源不同而有所差異】?
➜【零用金來源種類】➜有3種➜【家中給予,打工賺取,兩者皆有】

➜☎【請問】:這個分析題目的多個變數關係(x,y),分別是什麼?
➜☎【請問】:這樣子的數據,該用什麼【統計檢定】?
➜☎【請問】:這個是【雙尾檢定,還是右尾檢定,還是左尾檢定】?


☎※(2).【判斷檢定方法的最重要圖表】:

➜根據(x, y)對應的不同格式,可以選擇不同的統計檢定方法:

➜【比較1】:【獨立樣本t檢定】:針對2組資料,來比較這2組平均數的差異
➜【比較2】:【單因子變異數分析】:針對3組(或以上)資料,來比較這3組(或以上)平均數的差異


※(3).下載問卷調查資料:每月刷卡金額
※開啟【310-2-每月刷卡金額.csv】
➜【零用金來源種類】➜有3種➜【家中給予,打工賺取,兩者皆有】

※(4).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗
➜建立2個欄位:
➜【零用金來源】:數值
➜【刷卡金額】:數值
➜在【零用金來源】的【值】➜輸入3種標籤:【1家中給予,2打工賺取,3兩者皆有】
➜複製貼上csv的數據

※(5).建立【單因子變異數分析】
➜上方【分析】➜【比較平均數法】➜【單因數變異數分析】
➜設定【依變數清單】➜【刷卡金額】
➜設定【因子】➜【零用金來源】➜(只有一個因子,所以稱呼為【單因子】)
➜設定【選項】➜【統計量】➜勾選【描述統計】


※(6).要判斷這是【雙尾檢定,還是單尾檢定?】
➜【注意1】:【單因子變異數分析(ANOVA)】通常使用【雙尾】檢定。不考慮【單尾】檢定
➜【注意2】:【獨立樣本t檢定】通常使用【雙尾】檢定。不考慮【單尾】檢定
➜雙尾檢定



※(7).看【顯著性值】
➜判斷【顯著性是否<0.05】:0.636>0.05➜表示接受【虛無假設H0,3種方式的刷卡,差異明顯不同,沒有明顯趨勢】
➜【平均值】:【4557,2000,5418】,差異頗大
➜【經過檢定後發現】:p= 0.636>0.05信賴水準0.05,所以符合虛無假設(3種方式的刷卡,差異明顯不同,沒有明顯趨勢)



※(8).【結論】:3種方式的刷卡,差異明顯不同,沒有明顯趨勢
※(8).【結論】:大學生的刷卡金額,與他零用金來源方式,是無關聯的

※(1).【成果Demo】:多種分析【大學生每月手機支出月費,與【男女性別】與否而有差異嗎?與【居住狀況】不同而有差異嗎?
➜【居住狀況】➜有3種➜【1家裡,2學校宿舍,3校外】
➜【性別】➜有2種➜【1男,2女】
➜【是否有手機】➜有2種➜【1有手機,2無手機】

➜☎【請問】:這個分析題目的多個變數關係(x,y),分別是什麼?
➜☎【請問】:這樣子的數據,該用什麼【統計檢定】?
➜☎【請問】:這個是【雙尾檢定,還是右尾檢定,還是左尾檢定】?


☎※(2).【判斷檢定方法的最重要圖表】:

➜根據(x, y)對應的不同格式,可以選擇不同的統計檢定方法:

➜【比較1】:【獨立樣本t檢定】:針對2組資料,來比較這2組平均數的差異
➜【比較2】:【單因子變異數分析】:針對3組(或以上)資料,來比較這3組(或以上)平均數的差異


※(3).下載問卷調查資料:手機平均月費
※開啟【310-3-手機平均月費.csv】
➜【居住狀況】➜有3種➜【1家裡,2學校宿舍,3校外】
➜【性別】➜有2種➜【1男,2女】
➜【是否有手機】➜有2種➜【1有手機,2無手機】

※(4).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗
➜建立5個欄位:
➜【編號】:數值
➜【是否有手機】:數值➜(值輸入標籤:【1有手機,2無手機】)
➜【平均月費】:數值
➜【性別】:數值➜有2種➜【1男,2女】
➜【居住狀況】:數值➜有3種➜【1家裡,2學校宿舍,3校外】
設定【5種欄位】,示意圖
➜複製貼上csv的數據
【貼上數據】,示意圖

※(5).分析【不同男女性別】,手機月費是否有差異嗎?
※建立【獨立樣本t檢定】
➜上方【分析】➜【比較平均數法】➜【獨立樣本t檢定】
➜設定【檢定變數】➜【平均月費】
➜設定【分組變數】➜【性別】
➜點按【定義群組】:
➜設定【群組1】➜1
➜設定【群組2】➜2

➜【經過檢定後發現】:p= 0.000<0.05信賴水準0.05,所以符合獨立假設(不同性別的手機月費,差異明顯)
➜【看平均值】:男68,女114


※(6).分析【不同居住狀況】,手機月費是否有差異嗎?
➜建立【單因子變異數分析】
➜上方【分析】➜【比較平均數法】➜【單因數變異數分析】
➜設定【依變數清單】➜【平均月費】
➜設定【因子】➜【居住狀況】➜(只有一個因子,所以稱呼為【單因子】)
➜設定【選項】➜【統計量】➜勾選【描述統計】

➜【經過檢定後發現】:p= 0.008<0.05信賴水準0.05,所以符合獨立假設(不同居住狀況的手機月費,差異明顯)
➜【看平均值】:住家裡835,學校宿舍610,校外728

※(1).【問卷表單設計】:共有2題:
※【第1題】:1.請問您最常使用的品牌為何?(單選)
➜答案選項:1.海倫仙度絲,2.飛柔,3.mod's hair,4.沙宣,5.麗仕,6.花王,7.多芬,8.絲逸歡,9.潘婷,10.其它

※【第2題】:2.購買洗髮精考慮的因素,請勾選考量程度
➜答案選項:1.非常不重要,2.不重要,3.普通,4.重要,5.非常重要
➜考量因素選項:去頭皮屑,保濕,熱油護髮,止癢,香味,防止分岔,柔順,整體效果

【請問1】:該如何用Google表單設計出如此表單?
【請問2】:而且答案都必須儲存成數字1,2,3...(不可以儲存成文字:海倫仙度絲,飛柔)

※(2).【設計表單的困難度】:
【特別注意】:若是問卷表單的欄位要用數值儲存,所以【選擇題/5點量表】的答案選項,也要用【1,2,3...】,儲存到試算表才會是數字
➜【困難度】:答案選項若是1,2,3,如何讓人知道【1.海倫仙度絲,2.飛柔,3.mod's hair】呢?


➜【困難度】:答案選項若是1,2,3,4,5,如何讓人知道【1:是重要,還是不重要】呢?

※(3).【表單設計的解決方法】:
【成果】開啟Google問卷調查表單檔案:對於洗面乳選購的在意點調查
【特別注意】:若是問卷表單的欄位要用數值儲存,則選擇題,盡量用【5點量表】/【2點量表】來製作,欄位儲存的值才會是1,2,3...
➜【如何勾選【1.海倫仙度絲】,但卻可以在試算表儲存數字『1』】?
➜【方法】:在每一題的想法[...]➜選擇【說明】


➜【第1題的說明】:【說明】:1.海倫仙度絲,2.飛柔,3.mod's hair,4.沙宣,5.麗仕,6.花王,7.多芬,8.絲逸歡,9.潘婷,10.其它
➜【第2題的說明】:【說明】:1.非常不重要,2.不重要,3.普通,4.重要,5.非常重要

※(4).【輸入3筆數據法】:
➜開啟【連結的google試算表】
回覆後建立的Google試算表檔案:38-4.-男女對於洗髮精選購的在意點調查 (回覆)
輸入3筆數據法,示意圖
➜【檔案】➜【下載】➜【男女對於洗髮精選購的在意點調查.xlsx】
➜把【時間戳記】➜修改成【編號】➜這個欄位,滑鼠右鍵➜修改【儲存格格式】➜改成【數值】➜小數點0位
➜修改編號的值,輸入【1,2,3,.....】
➜修改欄位名稱【使用品牌,去頭皮屑,保濕,熱油護髮,止癢,香味,防止分岔,柔順,整體效果】
修改後的excel數據畫面,示意圖

※(5).下載問卷調查的完整資料:消費者對於洗髮精選購的在意點調查
※開啟【310-4-消費者對於洗髮精選購的在意點調查.csv】,
➜複製csv的數據,貼到excel檔案
修改後的excel數據畫面,示意圖
※(6).【分析題目】:【消費者購買洗髮精【考慮的因素】會隨著【選擇品牌的不同】,而有顯著差異嗎?(1)

➜☎【請問1】:探討上面問卷的2個變數【品牌(10個選項)】vs【購買洗髮精考慮因素(選項有8個)】,它們的關係是【類別vs類別】,還是【類別vs連續數值】?
➜☎【請問2】:探討這樣子【品牌(10個選項)】vs【購買洗髮精考慮因素(選項有8個)】彼此關聯,該用什麼【統計檢定】?
➜☎【請問3】:這個是【雙尾檢定,還是右尾檢定,還是左尾檢定】?


☎※(7).【判斷檢定方法的最重要圖表】:

➜根據(x, y)對應的不同格式,可以選擇不同的統計檢定方法:

➜若只有1個連續數值(y),則要選擇【單一樣本t檢定】方法
【重要觀念】:問卷表單的5點量表,看似是【類別,5個種類】,但是當我們輸入到excel後,它是用1~5輸入,最後會計算【平均值】
【重要觀念】:所以5點量表的【欄位】,是【數值】欄位,不是【類別】欄位

※(8).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗,建立10個欄位
➜【編號】
➜【使用品牌】:數值➜在【值】欄位建立標籤(1.海倫仙度絲,2.飛柔,3.mod's hair,4.沙宣,5.麗仕,6.花王,7.多芬,8.絲逸歡,9.潘婷,10.其它)
➜【去頭皮屑】:數值➜在【值】欄位建立標籤(1.非常不重要,2.不重要,3.普通,4.重要,5.非常重要)
➜【保濕】:數值➜在【值】欄位建立標籤(1.非常不重要,2.不重要,3.普通,4.重要,5.非常重要)
➜【熱油護髮】:數值➜在【值】欄位建立標籤(1.非常不重要,2.不重要,3.普通,4.重要,5.非常重要)
➜【止癢】:數值➜在【值】欄位建立標籤(1.非常不重要,2.不重要,3.普通,4.重要,5.非常重要)
➜【香味】:數值➜在【值】欄位建立標籤(1.非常不重要,2.不重要,3.普通,4.重要,5.非常重要)
➜【止癢】:數值➜在【值】欄位建立標籤(1.非常不重要,2.不重要,3.普通,4.重要,5.非常重要)
➜【防止分岔】:數值➜在【值】欄位建立標籤(1.非常不重要,2.不重要,3.普通,4.重要,5.非常重要)
➜【柔順】:數值➜在【值】欄位建立標籤(1.非常不重要,2.不重要,3.普通,4.重要,5.非常重要)
➜【整體效果】:數值➜在【值】欄位建立標籤(1.非常不重要,2.不重要,3.普通,4.重要,5.非常重要)
➜將excel的全部數據,複製貼到SPSS
設定變數,示意圖1貼上數據,示意圖2

※(9).建立【單因子變異數分析
➜上方【分析】➜【比較平均數法】➜【單因子變異數分析】
➜設定【依變數清單】➜【去頭皮屑,保濕,熱油護髮,止癢,香味,防止分岔,柔順,整體效果】
➜設定【因子】➜【使用品牌】➜(只有一個因子,所以稱呼為【單因子】)
設定參數,示意圖1

※(10).要判斷這是【雙尾檢定,還是單尾(左/右尾)檢定?】
➜【單因子變異數分析】,只有1個【雙尾檢定】

※(11).【單因子變異數分析檢定】
平均值,示意圖1
顯著性值p,示意圖1
➜判斷【顯著性是否<0.05】:
➜【去頭皮屑,熱油護髮,止癢,香味】的【顯著性值】都>0.05➜表示接受【虛無假設H0】➜【消費者考慮這些因素,與品牌的選擇,沒有明顯差異】
➜【保濕,防止分岔,柔順,整體效果】的【顯著性值】都<0.05➜表示接受【對立假設H1】➜【消費者考慮這些因素,與品牌的選擇,有明顯差異】
➜考慮【保濕,防止分岔,柔順,整體效果】時,會同時考慮品牌
➜考慮【保濕】時,會同時考慮品牌,品牌排序首選前3名是【1.mod's hair,2.海倫仙度絲,3.多芬】

➜考慮【防止分岔】時,會同時考慮品牌,品牌排序首選前3名是【1.mod's hair,2.海倫仙度絲,3.多芬】

➜考慮【柔順】時,會同時考慮品牌,品牌排序首選前3名是【1.mod's hair,2.海倫仙度絲,3.多芬】
➜考慮【整體效果】時,會同時考慮品牌,品牌排序首選前3名是【1.mod's hair,2.海倫仙度絲,3.多芬】


※(12).【結論1】:消費者在選購洗髮精時,在考慮【去頭皮屑,熱油護髮,止癢,香味】時,【不會考慮品牌】
※【結論2】:消費者在選購洗髮精時,在考慮【保濕,防止分岔,柔順,整體效果】時,【會考慮品牌】
※【結論3】:若是看平均數字,消費者在【會考慮品牌】時,首選品牌前3名是【1.mod's hair,2.海倫仙度絲,3.多芬】
※【結論4】:若是看平均數字,消費者購買洗髮精【會考慮因素】的排序,重要程度依次是【柔順,整體效果,保濕,止癢,防止分岔】

平均值,示意圖

※(13).【發現問題】:數據太雜亂,無法精簡,一目了然地描述
➜在撰寫報告時,若只是參考SPSS的輸出表格,會因為參數太多,而很難一目了然地說明數據
➜所以一般會把【SPSS表格➜貼到Excel修改,排序,彙整一個精簡表格➜貼到Word寫報告】

※(1).【成果Demo】:把上述【消費者對於洗面乳選購的檢定】➜撰寫分析報告【SPSS➜Excel➜Word】(3)



【下載Excel成果檔案】
【下載Word分析報告檔案】


※【上面是成果報告】,【下面是實際的做法與步驟】



※(2).先建立【觀測值摘要】
➜【原因】:因為我們要排序,還要分組分群分析比較,所以首選【觀測值摘要】
➜SPSS開啟上1個資料檔案➜在上方【分析】➜【報告】➜【觀測值摘要】
➜設定【變數】➜【去頭皮屑,保濕,熱油護髮,止癢,香味,防止分岔,柔順,整體效果】
➜設定【分組清單】➜【使用品牌】
➜設定【統計資料】➜選【平均數】
➜取消勾選【顯示觀察值】
設定參數,示意圖


※(3).將SPSS【觀察值摘要】表格【複製】到【Excel】
➜在表格➜【滑鼠右鍵】➜【複製】
➜貼到Excel去編輯每1個表格
➜複製➜【A3:I10】
【貼表格到Excel編輯】,示意圖
➜到新的工作表的【B1】➜【選擇性貼上/轉置(T)】
【選擇性貼上/轉置(T)】,示意圖

➜到【A1】➜輸入【編號】➜新增編號1,2,3,4....7


※(4).【計算排名】
➜到【J1】➜輸入【排名】
➜到【J2】➜輸入公式【=RANK(I2, $I$2:$I$9)】

➜到【B10】➜輸入【樣本數】
➜到【C10:I10】➜輸入【22,14,22,10,20,36,124】


※(5).到SPSS顯示【單因子變異數分析表格】
➜在表格➜【滑鼠右鍵】➜【複製】
➜貼到Excel➜【到新的工作表】➜到【B1】➜貼上
【貼表格到Excel,並刪除某些欄位列】,示意圖
➜刪除【第C~F欄】
➜刪除【第1列】
【刪除後】,示意圖

➜在【A2:B2】輸入儲存格文字【編號,屬性】➜

※(6).【刪除空白列】
選取【空白列】刪除,示意圖1
【成果】,示意圖

※(7).複製第3個工作表的【C:D 2個欄】到【第1個工作表『觀察值摘要』的最後2個欄位】
➜修改【最後1個欄位:H欄】的【標題】➜【顯著性】
【成果】,示意圖

※(8).在【M1】➜輸入【<α】(判斷是否符合p<0.05)
➜在【H10】➜輸入【=IF(L2<0.05, "*", "")】➜公式套用到【M2~M9】
【公式套用到相關欄位,再原地選擇性貼上:值】,示意圖

※(9).表格加上【內外框線】

【下載Excel成果檔案】

※(14).將表格複製貼到到【Word】➜寫成【分析報告】
【下載Word分析報告檔案】

【3-11-相關性研究】:探討2個變數之間的相關性(2種方法:相關係數法,繪製散佈圖法)

※(1).【成果Demo】:探討A公司的【投放的廣告費】與【銷售量】的【相關性】?


※(2).【觀念】:探討2個變數之間的相關性,2種方法:
➜方法1:【相關係數法】
➜方法2:【繪製散佈圖法】

※(3).【觀念】:2個變數【相關係數法a】的可能情況:
➜粗分3種:正相關(a>0),無關(a=0),負相關(a<0)
➜定量精細分類:
1.【絕對值abs(a)<0.3】:低度相關
2.【0.3<絕對值abs(a)<0.7】:中度相關
3.【0.7<絕對值abs(a)<0.8】:高度相關
4.【絕對值abs(a)>0.8】:非常高度相關

※(4).下載問卷調查資料:廣告費與銷售量
※開啟【311-1-廣告費與銷售量.csv】

※(5).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗
➜建立3個欄位:
➜【月份】:數值
➜【廣告費】:數值
➜【銷售量】:數值
➜複製貼上csv的數據
設定【欄位】,示意圖貼上【數據】,示意圖

※(6).建立【2個變數之間的相關性分析】
➜上方【分析】➜【相關】➜【雙變異數】
【相關性-雙變異數】,示意圖
➜設定【變數】➜【廣告費,銷售量】
設定【參數】,示意圖


※(7).注意看:【相關係數】➜【皮爾森Peason相關係數】
➜【注意1】:必須在顯著性p<0.05,才會符合對立假設(2個變數相關性顯著),接著才能看【相關係數】的值(代表相關程度量化值)
➜【注意2】:如果顯著性p>0.05,則符合虛無假設(2個變數相關性不明顯)



※(8).看【顯著性值】
➜判斷【顯著性是否<0.05】:0.000<0.05➜表示接受【對立假設H1,2個變數相關性顯著】
➜【相關係數:皮爾森係數】:【0.923】>0.8,代表【非常高度正相關】
➜【**】符號:代表是【非常高度相關】



※(9).【結論1】:A公司的【投放的廣告費】與【銷售量】的【非常高度正相關】
※【結論2】:A公司的【投放廣告】,是有效果的,明顯帶來【銷售量】成長

※(1).【成果Demo】:探討A公司的【投放的廣告費】與【銷售量】的【相關性】?


※(2).【觀念】:探討2個變數之間的相關性,2種方法:
➜方法1:【相關係數法】
➜方法2:【繪製散佈圖法】

※(3).【觀念】:2個變數【相關係數法a】的可能情況:
➜粗分3種:正相關(a>0),無關(a=0),負相關(a<0)
➜定量精細分類:
1.【絕對值abs(a)<0.3】:低度相關
2.【0.3<絕對值abs(a)<0.7】:中度相關
3.【0.7<絕對值abs(a)<0.8】:高度相關
4.【絕對值abs(a)>0.8】:非常高度相關

※(4).【觀念】:散佈圖的功用:
1.【散佈圖是2個變數彼此之間關係的最原始數據呈現】,若彼此有關,即可一目了然
2.x軸稱為【自變數】
3.y軸稱為【因變數(依變數)】

※(5).下載問卷調查資料:廣告費與銷售量
※開啟【311-1-廣告費與銷售量.csv】

※(6).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗
➜建立3個欄位:
➜【月份】:數值
➜【廣告費】:數值
➜【銷售量】:數值
➜複製貼上csv的數據 貼上【數據】,示意圖

※(7).建立【散佈圖】
➜上方【圖形】➜【圖表編輯器】
➜【展示區】menu➜【散佈圖/點狀圖】➜double click【簡易散佈圖】
單選【簡易散佈圖】,示意圖
➜設定【x軸變數】➜【廣告費】
➜設定【y軸變數】➜【銷售量】
設定【x,y軸變數】,示意圖
➜【標題/註解】menu➜勾選【標題1】➜【內容】:廣告費與銷售量的關係圖
設定【標題】,示意圖


※(8).【結論】:廣告費與銷售量的散佈圖,可以看出具有正相關的線性關係

※(1).【成果Demo】:探討國中3甲班級的【國文成績】與【英文成績】的【相關性】?



※(2).【觀念】:探討2個變數之間的相關性,2種方法:
➜方法1:【相關係數法】
➜方法2:【繪製散佈圖法】

※(3).【觀念】:2個變數【相關係數法a】的可能情況:
➜粗分3種:正相關(a>0),無關(a=0),負相關(a<0)
➜定量精細分類:
1.【絕對值abs(a)<0.3】:低度相關
2.【0.3<絕對值abs(a)<0.7】:中度相關
3.【0.7<絕對值abs(a)<0.8】:高度相關
4.【絕對值abs(a)>0.8】:非常高度相關

※(4).下載問卷調查資料:國文英文成績
※開啟【311-3-國文英文成績.csv】

※(5).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗
➜建立3個欄位:
➜【編號】:數值
➜【國文】:數值
➜【英文】:數值
➜複製貼上csv的數據

※(6).建立【2個變數之間的相關性分析】
➜上方【分析】➜【相關】➜【雙變異數】
➜設定【變數】➜【國文,英文】


※(7).看【相關係數】➜【皮爾森Peason相關係數】
➜【注意1】:必須在顯著性p<0.05,才會符合對立假設(2個變數相關性顯著),接著才能看【相關係數】的值(代表相關程度量化值)
➜【注意2】:如果顯著性p>0.05,則符合虛無假設(2個變數相關性不明顯)
※看【顯著性值】
➜判斷【顯著性是否<0.05】:0.002<0.05➜表示接受【對立假設H1,2個變數相關性顯著】
➜【相關係數:皮爾森係數】:0.7<【0.792】<0.8,代表【高度正相關】
➜【**】符號:代表是【高度相關】


※(8).建立【散佈圖】
➜上方【圖形】➜【圖表編輯器】
➜【展示區】menu➜【散佈圖/點狀圖】➜double click【簡易散佈圖】
➜設定【x軸變數】➜【國文】
➜設定【y軸變數】➜【英文】
➜【標題/註解】menu➜勾選【標題1】➜【內容】:國文與英文的關係圖


※(9).【結論1】:國中3甲班級的【國文成績】與【英文成績】,【高度正相關】
※【結論2】:國中3甲班級學生的【國文成績】越高,【英文成績】也越高

※(1).【成果Demo】:【多個變數之間的相關矩陣】:探討汽車【鈑金,省油,價格】3個變數的相關性(但容易出現誤判)?


※(2).下載問卷調查資料:汽車鈑金省油價格相關性
※開啟【311-4-汽車鈑金省油價格相關性.csv】

※(3).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗
➜建立4個欄位:
➜【編號】:數值
➜【鈑金】:數值
➜【省油】:數值
➜【價格】:數值
➜複製貼上csv的數據

※(4).建立【3個變數之間的相關性分析】
➜上方【分析】➜【相關】➜【雙變異數】
➜設定【變數】➜【鈑金,省油,價格】


※(7).看【相關係數】➜【皮爾森Peason相關係數】
➜【注意1】:必須在顯著性p<0.05,才會符合對立假設(2個變數相關性顯著),接著才能看【相關係數】的值(代表相關程度量化值)
➜【注意2】:如果顯著性p>0.05,則符合虛無假設(2個變數相關性不明顯)
※看【顯著性值】
➜判斷【顯著性是否<0.05】:0.000<0.05➜表示接受【對立假設H1,2個變數相關性顯著】
➜【相關係數:皮爾森係數】:【0.915】>0.8,代表【高度正相關】
➜【**】符號:代表是【高度相關】


※(9).【結論1】:【鈑金 vs 省油】是【高度負相關】➜很好理解
※【結論2】:【鈑金 vs 價格】是【高度負相關】➜很好理解
※【結論3】:【省油 vs 價格】是【高度正相關】➜不好理解,會不會相關性判斷錯誤了?
➜【多變數的相關係數矩陣,容易出現錯誤判別】:因為【2個變數之間的關係,會受到其它第3,第4...個變數干擾而失真】

※(1).【成果Demo】:【多個變數之間的相關矩陣】:探討學生【成績,出席率,選修學分數,打工時數】4個變數的相關性?(但容易出現誤判)?


※(2).下載問卷調查資料:成績,出席率,學分數,打工時數相關性
※開啟【311-5-成績,出席率,學分數,打工時數相關性.csv】

※(3).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗
➜建立4個欄位:
➜【編號】:數值
➜【平均成績】:數值
➜【出席率】:數值
➜【選修學分】:數值
➜【打工時數】:數值
➜複製貼上csv的數據

※(4).建立【4個變數之間的相關性分析】
➜上方【分析】➜【相關】➜【雙變異數】
➜設定【變數】➜【平均成績,出席率,選修學分,打工時數】


※(7).看【相關係數】➜【皮爾森Peason相關係數】
➜【注意1】:必須在顯著性p<0.05,才會符合對立假設(2個變數相關性顯著),接著才能看【相關係數】的值(代表相關程度量化值)
➜【注意2】:如果顯著性p>0.05,則符合虛無假設(2個變數相關性不明顯)
※看【顯著性值】
➜判斷【顯著性是否<0.05】:0.000<0.05➜表示接受【對立假設H1,2個變數相關性顯著】
➜【相關係數:皮爾森係數】:0.7<【-0.715】<0.8,代表【高度負相關】
➜【*】符號:代表是【高度相關】


※(9).【結論1】:【平均成績 vs 出席率】是【無關】➜因為p=0.131>0.05,虛無假設,沒有顯著差異
※【結論2】:【平均成績 vs 選修學分】是【無關】➜因為p=0.073>0.05,虛無假設,沒有顯著差異
※【結論3】:【平均成績 vs 打工時數】是【高度負相關】➜因為p=0.014<0.05,對立假設,有顯著差異➜相關係數是-0.714
※【結論4】:【出席率 vs 選修學分】是【中度相關】➜因為p=0.049<0.05,對立假設,有顯著差異➜相關係數是0.604
※【結論5】:【出席率 vs 打工時數】是【無關】➜因為p=0.528>0.05,虛無假設,沒有顯著差異
※【結論6】:【選修學分 vs 打工時數】是【無關】➜因為p=0.644>0.05,虛無假設,沒有顯著差異
※【結論7】:【多變數的相關係數矩陣,容易出現錯誤判別】:因為【2個變數之間的關係,會受到其它第3,第4...個變數干擾而失真】


※(10).【觀念】:2個變數【相關係數法a】的可能情況:
➜粗分3種:正相關(a>0),無關(a=0),負相關(a<0)
➜定量精細分類:
1.【絕對值abs(a)<0.3】:低度相關
2.【0.3<絕對值abs(a)<0.7】:中度相關
3.【0.7<絕對值abs(a)<0.8】:高度相關
4.【絕對值abs(a)>0.8】:非常高度相關

※(1).【chp311-4的成果Demo】:【多個變數之間的相關矩陣】:探討汽車【鈑金,省油,價格】3個變數的相關性?

※【當初的結論】:【省油 vs 價格】是【高度正相關】➜不好理解,會不會相關性判斷錯誤了?
➜【這個結論,是錯誤的】

【正確做法】:偏相關(淨相關)



※上面是成果,下面開始實作:

※(2).下載問卷調查資料:汽車鈑金省油價格相關性
※開啟【311-4-汽車鈑金省油價格相關性.csv】

※(3).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗
➜建立4個欄位:
➜【編號】:數值
➜【鈑金】:數值
➜【省油】:數值
➜【價格】:數值
➜複製貼上csv的數據

※(4).建立【3個變數之間的相關性分析】
➜上方【分析】➜【相關】➜【局部】
➜ (注意:學校的SPSS版本為23版,沒有翻譯成【偏相關,Partial】,而是翻譯成【局部】)
【其它SPSS版本,翻譯成偏相關】,示意圖
➜設定【變數】➜【省油,價格】
➜設定【為此項目進行控制】➜【鈑金】
設定【參數】,示意圖


※(7).看【相關係數】➜【皮爾森Peason相關係數】
➜【注意1】:必須在顯著性p<0.05,才會符合對立假設(2個變數相關性顯著),接著才能看【相關係數】的值(代表相關程度量化值)
➜【注意2】:如果顯著性p>0.05,則符合虛無假設(2個變數相關性不明顯)
※判斷【顯著性是否<0.05】:0.571>0.05➜表示接受【虛無假設H0,2個變數相關性不顯著】


※(8).【結論】:
※【結論1】:【省油 vs 價格】其實是【無關的】➜省油的車,不一定貴,也不一定便宜

※【結論2】:若是用【多變數的相關係數矩陣,容易出現錯誤判別】:
➜當初的判斷是:【省油 vs 價格】是【高度正相關】➜不好理解,會不會相關性判斷錯誤了?
➜【原因】:因為多變數的相關係數矩陣,容易出現錯誤判別,因為【2個變數之間的關係,會受到其它第3,第4...個變數干擾而失真】
➜【正確做法】:【先固定其它變數】,只【探討2個變數】,這種相關性係數才准確

※【結論3】:【多變數的相關性探討】,要用【偏相關】法,才會準確

※(1).【chp311-4的成果Demo】:【偏相關(Partial,淨相關):多個變數之間排除其他條件的專門檢定2個變數】:探討學生【平均成績 vs 打工時數】4個變數的2個變數的相關性?

※【當初的結論】:【結論4】:【出席率 vs 選修學分】是【中度相關】
➜【這個結論,是錯誤的】

【正確做法】:偏相關(淨相關)



※上面是成果,下面開始實作:

※(2).下載問卷調查資料:成績,出席率,學分數,打工時數相關性
※開啟【311-5-成績,出席率,學分數,打工時數相關性.csv】

※(3).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗
➜建立4個欄位:
➜【編號】:數值
➜【平均成績】:數值
➜【出席率】:數值
➜【選修學分】:數值
➜【打工時數】:數值
➜複製貼上csv的數據

※(4).建立【3個變數之間的相關性分析】
➜上方【分析】➜【相關】➜【局部】
➜ (注意:學校的SPSS版本為23版,沒有翻譯成【偏相關,Partial】,而是翻譯成【局部】)
【其它SPSS版本,翻譯成偏相關】,示意圖
➜設定【變數】➜【出席率,選修學分】
➜設定【為此項目進行控制】➜【平均成績,打工時數】
設定【參數】,示意圖


※(7).看【相關係數】➜【皮爾森Peason相關係數】
➜【注意1】:必須在顯著性p<0.05,才會符合對立假設(2個變數相關性顯著),接著才能看【相關係數】的值(代表相關程度量化值)
➜【注意2】:如果顯著性p>0.05,則符合虛無假設(2個變數相關性不明顯)
※判斷【顯著性是否<0.05】:0.265>0.05➜表示接受【虛無假設H0,2個變數相關性不顯著】


※(8).【結論】:
※【結論1】:【出席率 vs 選修學分】是【無關】的

※【結論2】:若是用【多變數的相關係數矩陣,容易出現錯誤判別】:
➜當初的判斷是:【出席率 vs 選修學分】是【中度相關】➜因為p=0.049<0.05,對立假設,有顯著差異➜相關係數是0.604
➜【原因】:因為多變數的相關係數矩陣,容易出現錯誤判別,因為【2個變數之間的關係,會受到其它第3,第4...個變數干擾而失真】
➜【正確做法】:【先固定其它變數】,只【探討2個變數】,這種相關性係數才准確

※【結論3】:【多變數的相關性探討】,要用【偏相關】法,才會準確

【3-12-迴歸分析】:探討依變數y與自變數x之間的迴歸方程式

※(1).【成果Demo】:
※【線性迴歸方程式】:y = 10.467*x (y是銷售量,x是廣告費)


-----------------------------
※(2).下載問卷調查資料:廣告費與銷售量
※開啟【312-1-廣告費與銷售量.csv】

※(3).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗
➜建立2個欄位:
➜【廣告費】:數值
➜【銷售量】:數值
➜複製貼上csv的數據 貼上【數據】,示意圖

※(4).建立【含有常數項的迴歸方程式】
➜上方【分析】➜【迴歸】➜【線性】
➜設定【依變數】➜【銷售量】
➜設定【自變數】➜【廣告費】
➜設定【方法】➜【輸入】
➜設定【統計資料】➜勾選【估計值】➜勾選【模型配適度】
設定【參數】,示意圖


※(5).先看【變異數分析】表格➜【可以評估這個自變數x與依變數y之間是否有顯著的迴歸線關係?】
➜【注意1】:必須在顯著性p<0.05,才會符合對立假設(x,y這2個變數的迴歸線顯著)
➜【注意2】:如果顯著性值p>0.05,則符合虛無假設(x,y這2個變數的迴歸線不明顯)
➜【結果】:必須在顯著性p=0.000<0.05,符合對立假設(x,與y之間有顯著的迴歸線關係)

※(6).再看【係數】表格
➜如何知道迴歸方程式與係數:y=ax+b
➜係數表格的【非標準化係數】欄位➜【B】值➜就是係數

➜(常數)的B值 = 306.106➜就是y=ax+b的【b值】
➜(廣告費x)的B值 = 9.131➜就是y=ax+b的【a值】
➜【方程式】:y = 9.131*x +306.106

※(7).再看【顯著性】欄位:
※看(常數)的【顯著性】值 = 0.227>0.05 ➜支持【虛無】假設➜(常數)項可以忽略,不重要
➜就是 y = ax + b 的【b】係數,可以省略


※看(廣告費x)的【顯著性】值 = 0.000<0.05 ➜支持【對立】假設➜(廣告費x)項關係重要,顯著影響
➜就是 y = ax + b 的【a】係數,不可以省略
※【迴歸方程式】: y = 9.131*x (y是銷售量,x是廣告費)


-----------------------------
※(8).重新再建立【沒有含有常數項的迴歸方程式】
➜上方【分析】➜【迴歸】➜【線性】
➜設定【依變數】➜【銷售量】
➜設定【自變數】➜【廣告費】
➜設定【方法】➜【輸入】
➜設定【選項】➜取消勾選【在方程式中併入常數】
取消勾選【在方程式中併入常數】,示意圖





※(9).再看【係數】表格
➜如何知道迴歸方程式與係數:y=ax+b
➜係數表格的【非標準化係數】欄位➜【B】值➜就是係數

➜【方程式】:y = 10.467*x

※(10).再看【顯著性】欄位:
※看(廣告費x)的【顯著性】值 = 0.000<0.05 ➜支持【對立】假設➜(廣告費x)項關係重要,顯著影響
※【最後的線性迴歸方程式】:y = 10.467*x (y是銷售量,x是廣告費)

※(11).【結論】:
※【線性迴歸方程式】:y = 10.467*x (y是銷售量,x是廣告費)

※(1).【成果Demo】:
※【線性迴歸方程式】:y = 0.858*x (y是銀行放款金額,x是銀行存款金額)


-----------------------------
※(2).下載問卷調查資料:銀行之存款放款餘額
※開啟【312-2-銀行之存款放款餘額.csv】

※(3).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗
➜建立3個欄位:
➜【分行】:數值
➜【存款餘額】:數值
➜【放款餘額】:數值
➜複製貼上csv的數據 貼上【數據】,示意圖

※(4).建立【含有常數項的迴歸方程式】
➜上方【分析】➜【迴歸】➜【線性】
➜設定【依變數】➜【銷售量】
➜設定【自變數】➜【廣告費】
➜設定【方法】➜【輸入】
➜設定【統計資料】➜勾選【估計值】➜勾選【模型配適度】
設定【參數】,示意圖


※(5).先看【變異數分析】表格➜【可以評估這個自變數x與依變數y之間是否有顯著的迴歸線關係?】
➜【注意1】:必須在顯著性p<0.05,才會符合對立假設(x,y這2個變數的迴歸線顯著)
➜【注意2】:如果顯著性值p>0.05,則符合虛無假設(x,y這2個變數的迴歸線不明顯)
➜【結果】:必須在顯著性p=0.000<0.05,符合對立假設(x,與y之間有顯著的迴歸線關係)

※(6).再看【係數】表格
➜如何知道迴歸方程式與係數:y=ax+b
➜係數表格的【非標準化係數】欄位➜【B】值➜就是係數

➜(常數)的B值 = -2.928➜就是y=ax+b的【b值】
➜(廣告費x)的B值 = 0.89➜就是y=ax+b的【a值】
➜【方程式】:y = 0.89*x -2.928

※(7).再看【顯著性】欄位:
※看(常數)的【顯著性】值 = 0.144>0.05 ➜支持【虛無】假設➜(常數)項可以忽略,不重要
➜就是 y = ax + b 的【b】係數,可以省略


※看(廣告費x)的【顯著性】值 = 0.000<0.05 ➜支持【對立】假設➜(廣告費x)項關係重要,顯著影響
➜就是 y = ax + b 的【a】係數,不可以省略
※【迴歸方程式】: y = 0.89*x (y是銀行放款金額,x是銀行存款金額)


-------------------------------------
※(8).重新再建立【沒有含有常數項的迴歸方程式】
➜上方【分析】➜【迴歸】➜【線性】
➜設定【依變數】➜【銷售量】
➜設定【自變數】➜【廣告費】
➜設定【方法】➜【輸入】
➜設定【選項】➜取消勾選【在方程式中併入常數】
取消勾選【在方程式中併入常數】,示意圖





※(9).再看【係數】表格
➜如何知道迴歸方程式與係數:y=ax+b
➜係數表格的【非標準化係數】欄位➜【B】值➜就是係數

➜【方程式】:y = 0.858*x

※(10).再看【顯著性】欄位:
※看(廣告費x)的【顯著性】值 = 0.000<0.05 ➜支持【對立】假設➜(廣告費x)項關係重要,顯著影響
※【最後的線性迴歸方程式】:y = 0.858*x (y是銀行放款金額,x是銀行存款金額)

※(11).【結論】:
※【線性迴歸方程式】:y = 0.858*x (y是銀行放款金額,x是銀行存款金額)

※(1).【成果Demo】:
※【線性迴歸方程式】:y = -5.612*x +62.667 (y是價格,x是車齡)


-----------------------------
※(2).下載問卷調查資料:中古車車齡與車價
※開啟【312-3-中古車車齡與車價.csv】

※(3).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗
➜建立3個欄位:
➜【車齡】:數值
➜【里程數】:數值
➜【價格】:數值
➜複製貼上csv的數據

※(4).在【變數視圖】視窗➜【建立標籤】
➜【里程數】的【標籤】:萬公里
➜【價格】的【標籤】:萬

【建立標籤】,示意圖

※(4).建立【含有常數項的迴歸方程式】
➜上方【分析】➜【迴歸】➜【線性】
➜設定【依變數】➜【價格】
➜設定【自變數】➜【車齡】
➜設定【方法】➜【輸入】
➜設定【統計資料】➜勾選【估計值】➜勾選【模型配適度】
設定【參數】,示意圖


※(5).先看【變異數分析】表格➜【可以評估這個自變數x與依變數y之間是否有顯著的迴歸線關係?】
➜【注意1】:必須在顯著性p<0.05,才會符合對立假設(x,y這2個變數的迴歸線顯著)
➜【注意2】:如果顯著性值p>0.05,則符合虛無假設(x,y這2個變數的迴歸線不明顯)
➜【結果】:必須在顯著性p=0.000<0.05,符合對立假設(x,與y之間有顯著的迴歸線關係)

※(6).再看【係數】表格
➜如何知道迴歸方程式與係數:y=ax+b
➜係數表格的【非標準化係數】欄位➜【B】值➜就是係數

➜(常數)的B值 = 62.667➜就是y=ax+b的【b值】
➜(廣告費x)的B值 =-5.612➜就是y=ax+b的【a值】
➜【方程式】:y = -5.612*x +62.667

※(7).再看【顯著性】欄位:
※看(常數)的【顯著性】值 = 0.000<0.05 ➜支持【對立】假設➜(常數)項不可以忽略
➜就是 y = ax + b 的【b】係數,不可以省略


※看(廣告費x)的【顯著性】值 = 0.000<0.05 ➜支持【對立】假設➜(廣告費x)項關係重要,顯著影響
➜就是 y = ax + b 的【a】係數,不可以省略
※【迴歸方程式】: y = -5.612*x +62.667 (y是價格,x是車齡)



※(11).【結論】:
※【線性迴歸方程式】:y = -5.612*x +62.667 (y是價格,x是車齡)

※(1).【成果Demo】:
※【線性迴歸方程式】:y = -5.612*x +62.667 (y是價格,x是車齡)



-----------------------------
※(2).下載問卷調查資料:中古車車齡與車價
※開啟【312-3-中古車車齡與車價.csv】

※(3).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗
➜建立3個欄位:
➜【車齡】:數值
➜【里程數】:數值
➜【價格】:數值
➜複製貼上csv的數據

※(4).在【變數視圖】視窗➜【建立標籤】
➜【里程數】的【標籤】:萬公里
➜【價格】的【標籤】:萬

【建立標籤】,示意圖

※(4).建立【含有常數項的迴歸方程式】
➜上方【分析】➜【迴歸】➜【曲線估計】(注意:若是選【線性】,則無法看繪圖)
➜設定【因變數】➜【價格】
➜設定【自變數】➜【車齡】
➜勾選【方程式帶有常數項】
➜勾選【印出模式的線形圖】
➜勾選【模型】➜勾選【線性】





※(5).先看【變異數分析】表格➜【可以評估這個自變數x與依變數y之間是否有顯著的迴歸線關係?】
➜【注意1】:必須在顯著性p<0.05,才會符合對立假設(x,y這2個變數的迴歸線顯著)
➜【注意2】:如果顯著性值p>0.05,則符合虛無假設(x,y這2個變數的迴歸線不明顯)
➜【結果】:必須在顯著性p=0.000<0.05,符合對立假設(x,與y之間有顯著的迴歸線關係)

※(6).再看【係數】表格
➜如何知道迴歸方程式與係數:y=ax+b
➜係數表格的【非標準化係數】欄位➜【B】值➜就是係數

➜(常數)的B值 = 62.667➜就是y=ax+b的【b值】
➜(廣告費x)的B值 =-5.612➜就是y=ax+b的【a值】
➜【方程式】:y = -5.612*x +62.667

※(7).再看【顯著性】欄位:
※看(常數)的【顯著性】值 = 0.000<0.05 ➜支持【對立】假設➜(常數)項不可以忽略
➜就是 y = ax + b 的【b】係數,不可以省略


※看(廣告費x)的【顯著性】值 = 0.000<0.05 ➜支持【對立】假設➜(廣告費x)項關係重要,顯著影響
➜就是 y = ax + b 的【a】係數,不可以省略
※【迴歸方程式】: y = -5.612*x +62.667 (y是價格,x是車齡)



※(11).【結論】:
※【線性迴歸方程式】:y = -5.612*x +62.667 (y是價格,x是車齡)

※(1).【成果Demo】:
※【迴歸方程式】: y = -34.672 x**2 +3287.152*x -38529.904(y是每月所得,x是年齡)



-----------------------------
※(2).下載問卷調查資料:年齡與所得
※開啟【312-5-年齡與所得.csv】

※(3).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗
➜建立2個欄位:
➜【年齡】:數值
➜【每月所得】:數值
➜複製貼上csv的數據

※(4).建立【含有常數項的迴歸方程式】
➜上方【分析】➜【迴歸】➜【曲線估計】(注意:若是選【線性】,則無法看繪圖)
➜設定【因變數】➜【每月所得】
➜設定【自變數】➜【年齡】
➜勾選【方程式帶有常數項】
➜勾選【印出模式的線形圖】
➜勾選【模型】➜勾選【線性】➜勾選【二次曲線模型】
➜勾選【顯示ANOVA摘要表】

【建立標籤】,示意圖




※(5).先看【變異數分析】表格➜【可以評估這個自變數x與依變數y之間是否有顯著的迴歸線關係?】
➜【注意1】:必須在顯著性p<0.05,才會符合對立假設(x,y這2個變數的迴歸線顯著)
➜【注意2】:如果顯著性值p>0.05,則符合虛無假設(x,y這2個變數的迴歸線不明顯)
➜【結果】:必須在顯著性p=0.000<0.05,符合對立假設(x,與y之間有顯著的迴歸線關係)

※(6).再看【係數】表格
➜如何知道迴歸方程式與係數:y=ax**2 + bx + c

➜(常數)的B值 = -38529.904➜就是y=ax**2 + bx + c的【c值】
➜(年齡x)的B值 =3287.152➜就是y=ax**2 + bx + c的【b值】
➜(年齡x**2)的B值 =-34.672➜y=ax**2 + bx + c的【a值】
➜【方程式】:y = -34.672 x**2 +3287.152*x -38529.904

※(7).再看【顯著性】欄位:
※看(常數)的【顯著性】值 = 0.000<0.05 ➜支持【對立】假設➜(常數)項不可以忽略
➜就是y=ax**2 + bx + c 的【b】係數,不可以省略
※看(x,x**2)的【顯著性】值 = 0.000<0.05 ➜支持【對立】假設➜(廣告費x)項關係重要,顯著影響
➜就是 y=ax**2 + bx + c的【a,b,c】係數,不可以省略
※【迴歸方程式】: y = -34.672 x**2 +3287.152*x -38529.904(y是每月所得,x是年齡)



※(8).【結論】:
※【線性迴歸方程式】:y = -34.672 x**2 +3287.152*x -38529.904(y是每月所得,x是年齡)

※(1).【成果Demo】:
※【對數迴歸方程式】: y = 21.512*ln(x) + 19.478(y是樹木高度,x是直徑)
※【二次曲線迴歸方程式】: y = -0.171*x**2+6.933*x + 19.639(y是樹木高度,x是直徑)



-----------------------------
※(2).下載問卷調查資料:樹木直徑與高度
※開啟【312-6-樹木直徑與高度.csv】

※(3).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗
➜建立2個欄位:
➜【直徑_吋】:數值
➜【高度_呎】:數值
➜複製貼上csv的數據

※(4).建立【含有常數項的迴歸方程式】
➜上方【分析】➜【迴歸】➜【曲線估計】(注意:若是選【線性】,則無法看繪圖)
➜設定【因變數】➜【高度_呎】
➜設定【自變數】➜【直徑_吋】
➜勾選【方程式帶有常數項】
➜勾選【印出模式的線形圖】
➜勾選【模型】➜勾選【線性,二次曲線,對數】
➜勾選【顯示ANOVA摘要表】



【對數曲線】


※(5).先看【變異數分析】表格➜【可以評估這個自變數x與依變數y之間是否有顯著的迴歸線關係?】
➜【注意1】:必須在顯著性p<0.05,才會符合對立假設(x,y這2個變數的迴歸線顯著)
➜【注意2】:如果顯著性值p>0.05,則符合虛無假設(x,y這2個變數的迴歸線不明顯)
➜【結果】:必須在顯著性p=0.000<0.05,符合對立假設(x,與y之間有顯著的迴歸線關係)

※(6).再看【對數-係數】表格
➜如何知道對數迴歸方程式與係數:y=a*ln(x) + b

➜(常數)的B值 = 19.478➜就是y=a*ln(x) + b的【b值】
➜(年齡x)的B值 =21.512➜就是y=a*ln(x) + b的【a值】
➜【方程式】:y = 21.512*ln(x) + 19.478

※(7).再看【對數-顯著性】欄位:
※看(常數)的【顯著性】值 = 0.000<0.05 ➜支持【對立】假設➜(常數)項不可以忽略
➜就是*ln(x) + b 的【b】係數,不可以省略
※看(x,x**2)的【顯著性】值 = 0.000<0.05 ➜支持【對立】假設➜(廣告費x)項關係重要,顯著影響
➜就是 *ln(x) + b的【a,b】係數,不可以省略
※【對數迴歸方程式】: y = 21.512*ln(x) + 19.478(y是樹木高度,x是直徑)


※(8).再看【二次曲線-顯著性】欄位:
※【二次曲線迴歸方程式】: y = -0.171*x**2+6.933*x + 19.639(y是樹木高度,x是直徑)

※(8).【結論】:
※【對數迴歸方程式】: y = 21.512*ln(x) + 19.478(y是樹木高度,x是直徑)
※【二次曲線迴歸方程式】: y = -0.171*x**2+6.933*x + 19.639(y是樹木高度,x是直徑)

※(1).【成果Demo】:
※【線性迴歸方程式】:y = -5.612*x +62.667 (y是價格,x是車齡)



-----------------------------
※(2).下載問卷調查資料:中古車車齡與車價
※開啟【312-7-中古車車齡與車價.csv】

※(3).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗
➜建立3個欄位:
➜【車齡】:數值
➜【里程數】:數值
➜【價格】:數值
➜複製貼上csv的數據

※(4).在【變數視圖】視窗➜【建立標籤】
➜【里程數】的【標籤】:萬公里
➜【價格】的【標籤】:萬

【建立標籤】,示意圖

※(4).建立【含有常數項的迴歸方程式】
➜上方【分析】➜【迴歸】➜【線性】
➜設定【依變數】➜【價格】
➜設定【自變數】➜【車齡,里程數】
➜設定【方法】➜【輸入】
➜設定【統計資料】➜勾選【估計值】➜勾選【模型配適度】
設定【參數】,示意圖


※(5).先看【變異數分析】表格➜【可以評估這個自變數x與依變數y之間是否有顯著的迴歸線關係?】
➜【注意1】:必須在顯著性p<0.05,才會符合對立假設(x,y這2個變數的迴歸線顯著)
➜【注意2】:如果顯著性值p>0.05,則符合虛無假設(x,y這2個變數的迴歸線不明顯)
➜【結果】:必須在顯著性p=0.000<0.05,符合對立假設(x1,x2,與y之間有顯著的迴歸線關係)

※(6).再看【係數】表格
➜如何知道迴歸方程式與係數:y=ax+b
➜係數表格的【非標準化係數】欄位➜【B】值➜就是係數

➜(常數)的B值 = 62.647➜查看顯著值【0.00】
➜(車齡x1)的B值 =-5.374➜查看顯著值【0.00】
➜(里程數x2)的B值 =-0.229➜查看顯著值【0.835】>0.005➜虛無假設➜效果不明顯
➜【方程式】:y = -5.374*x +62.647

-------------------------------------
※(7).重新再建立【曲線迴歸方程式】並【繪圖】
➜上方【分析】➜【迴歸】➜【曲線估計】(注意:若是選【線性】,則無法看繪圖)
➜設定【因變數】➜【價格】
➜設定【自變數】➜【車齡】
➜勾選【方程式帶有常數項】
➜勾選【印出模式的線形圖】
➜勾選【模型】➜勾選【線性】


※再看【係數】表格

➜(常數)的B值 = 62.667➜查看顯著值【0.00】
➜(車齡x1)的B值 =-5.612➜查看顯著值【0.00】
➜【方程式】:y = -5.612*x +62.667

※(8).【結論】:
※【線性迴歸方程式】:y = -5.612*x +62.667 (y是價格,x是車齡)

※(1).【成果Demo】:
※【線性迴歸方程式】:y = 4.131*x + 55.198 (y是信用分數,x1是總收入)



-----------------------------
※(2).下載問卷調查資料:信用分數-與收入,不動產,動產,房貸,撫養支出
※開啟【312-8-信用分數-與總收入,不動產,動產,房貸,撫養支出.csv】

※(3).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗
➜建立6個欄位:
➜【總收入】:數值
➜【不動產】:數值
➜【動產】:數值
➜【每月房貸】:數值
➜【撫養支出】:數值
➜【信用分數】:數值
➜複製貼上csv的數據


※(4).建立【含有常數項的多元複迴歸方程式】
➜上方【分析】➜【迴歸】➜【線性】
➜設定【依變數】➜【信用分數】
➜設定【自變數】➜【總收入,不動產,動產,房貸,撫養支出】
➜設定【方法】➜【輸入】
➜設定【統計資料】➜勾選【估計值】➜勾選【模型配適度】
設定【參數】,示意圖


※(5).先看【變異數分析】表格➜【可以評估這個自變數x與依變數y之間是否有顯著的迴歸線關係?】
➜【注意1】:必須在顯著性p<0.05,才會符合對立假設(x,y這2個變數的迴歸線顯著)
➜【注意2】:如果顯著性值p>0.05,則符合虛無假設(x,y這2個變數的迴歸線不明顯)
➜【結果】:必須在顯著性p=0.000<0.05,符合對立假設(x1,x2,與y之間有顯著的迴歸線關係)

※(6).再看【係數】表格

➜(常數)的B值 = 57.076➜查看顯著值【0.007】
➜(總收入x1)的B值 =-5.351➜查看顯著值【0.033】
➜(不動產x2)的B值 =0.704➜查看顯著值【0.528】>0.005➜虛無假設➜效果不明顯
➜(動產x3)的B值 =-4.962➜查看顯著值【0.458】>0.005➜虛無假設➜效果不明顯
➜(每月房貸x4)的B值 =-0.90➜查看顯著值【0.963】 >0.005➜虛無假設➜效果不明顯
➜(撫養支出x5)的B值 =-2.499➜查看顯著值【0.28】>0.005➜虛無假設➜效果不明顯

※結論1:客戶的【信用分數】與【不動產,動產,每月房貸,撫養支出】都無關
※結論2:客戶的【信用分數】與【總收入】有關
➜【2者關係的迴歸方程式】:y = -5.351*x1 + 57.076(y是信用分數,x1是總收入)


-------------------------------------
※(7).重新再建立【曲線迴歸方程式】並【繪圖】
➜上方【分析】➜【迴歸】➜【曲線估計】(注意:若是選【線性】,則無法看繪圖)
➜設定【依變數】➜【信用分數】
➜設定【自變數】➜【總收入】
➜勾選【方程式帶有常數項】
➜勾選【印出模式的線形圖】
➜勾選【模型】➜勾選【線性】


※再看【係數】表格

➜(常數)的B值 = 55.198➜查看顯著值【0.00】
➜(總收入x1)的B值 =4.131➜查看顯著值【0.00】
➜【方程式】:y = 4.131*x + 55.198(y是信用分數,x1是總收入)


※(8).【結論】:
※結論1:客戶的【信用分數】與【不動產,動產,每月房貸,撫養支出】都無關
※結論2:客戶的【信用分數】與【總收入】有關
※結論3:【2者關係的迴歸方程式】:y = 4.131*x + 55.198 (y是信用分數,x1是總收入)

※(1).【成果Demo】:
➜【多元迴歸方程式】:y = 0.103*x3 - 0.055*x4 + 0.55
➜【多元迴歸方程式】:出席率y = 0.103*上課內容x3 - 0.055*上課時段x4 + 0.55


-----------------------------
※(2).下載問卷調查資料:上課出席率
※開啟【312-9-上課出席率.csv】

※(3).用北科大軟體雲的SPSS新增新的檔案,先在【變數視圖】視窗
➜建立5個欄位:
➜【是否點名】:數值
➜【成績高低】:數值
➜【上課內容】:數值
➜【上課時段】:數值
➜【出席率】:數值
➜複製貼上csv的數據
➜【數值】為5點量表:1非常不同意.......5非常同意


※(4).建立【含有常數項的多元複迴歸方程式】
➜上方【分析】➜【迴歸】➜【線性】
➜設定【依變數】➜【出席率】
➜設定【自變數】➜【是否點名,成績高低,上課內容,上課時段】
➜設定【方法】➜【輸入】
➜設定【統計資料】➜勾選【估計值】➜勾選【模型配適度】


※(5).先看【變異數分析】表格➜【可以評估這個自變數x與依變數y之間是否有顯著的迴歸線關係?】
➜【注意1】:必須在顯著性p<0.05,才會符合對立假設(x,y這2個變數的迴歸線顯著)
➜【注意2】:如果顯著性值p>0.05,則符合虛無假設(x,y這2個變數的迴歸線不明顯)
➜【結果】:必須在顯著性p=0.000<0.05,符合對立假設(x1,x2,與y之間有顯著的迴歸線關係)

※(6).再看【係數】表格

➜(常數)的B值 = 0.479➜查看顯著值【0.007】
➜(是否點名x1)的B值 =0.026➜查看顯著值【0.277】>0.005➜虛無假設➜效果不明顯
➜(成績高低x2)的B值 =0.013➜查看顯著值【0.460】>0.005➜虛無假設➜效果不明顯
➜(上課內容x3)的B值 =0.1➜查看顯著值【0.002】
➜(上課時段x4)的B值 =-0.057➜查看顯著值【0.024】
➜【多元迴歸方程式】:y = 0.1*x3 - 0.057*x4 + 0.479
➜【多元迴歸方程式】:出席率y = 0.1*上課內容x3 - 0.057*上課時段x4 + 0.479


-------------------------------------
※(7).【無法】重新再建立【曲線迴歸方程式】並【繪圖】
➜【原因】:【曲線迴歸方程式】只能夠【自變數x1 vs 依變數y)➜【1對1】
➜【無法】:【多對1】
-------------------------------------
※(8).建立【含有常數項的多元複迴歸方程式】
➜上方【分析】➜【迴歸】➜【線性】
➜上方【分析】➜【迴歸】➜【線性】
➜設定【依變數】➜【出席率】
➜設定【自變數】➜【上課內容,上課時段】
➜設定【方法】➜【輸入】
➜設定【統計資料】➜勾選【估計值】➜勾選【模型配適度】

※再看【係數】表格

➜(常數)的B值 = 0.479➜查看顯著值【0.001】
➜(上課內容x3)的B值 =0.1➜查看顯著值【0.000】
➜(上課時段x4)的B值 =-0.057➜查看顯著值【0.014】
➜【多元迴歸方程式】:y = 0.103*x3 - 0.055*x4 + 0.55
➜【多元迴歸方程式】:出席率y = 0.103*上課內容x3 - 0.055*上課時段x4 + 0.55


※(9).【結論】:
➜【多元迴歸方程式】:y = 0.103*x3 - 0.055*x4 + 0.55
➜【多元迴歸方程式】:出席率y = 0.103*上課內容x3 - 0.055*上課時段x4 + 0.55

【四,實作:程式量化分析方法:Python統計分析(scipy統計模組)】

【五,實作:應用人工智慧於顧客區隔(Customer Segmentation)的分群預測,可找出不同的目標客群,然後做差異性行銷】

【5-1.三步驟的分類預測:Classification Prediction】

範例5-3.用sklearn模組,『簡易3步驟』建立『KNN,K鄰近』模型來預測『客戶關係管理裡面的客戶價值度』

範例5-4.用sklearn模組,『簡易3步驟』建立『邏輯迴歸』模型來預測『客戶關係管理裡面的客戶價值度』

範例5-7.用sklearn模組,『簡易3步驟』建立『支持向量機算法SVM』模型來預測『客戶關係管理裡面的客戶價值度』

【5-2.五步驟的分類預測:Classification Prediction】

範例6-3.用sklearn模組,『入門5步驟』建立『KNN,K鄰近』模型來預測『客戶關係管理裡面的客戶價值度』

範例6-4.用sklearn模組,『入門5步驟』建立『邏輯迴歸』模型來預測『客戶關係管理裡面的客戶價值度』

範例6-5.用sklearn模組,『入門6步驟』建立『決策樹tree』模型來預測『客戶關係管理裡面的客戶價值度』

【5-3.進階處理問題1:使用【標準化(Standardization)➜特徵縮放scaler】來處理輸入變數刻度差距很大,造成計算誤差與準確率低】

範例8-2.用標準化類別函數StandardScaler(),把『客戶關係管理的客戶價值度RFM資料集』先標準化處理,再用『sklearn邏輯迴歸模型』預測分類

範例8-3.用標準化類別函數StandardScaler(),把『客戶關係管理的客戶價值度RFM資料集』先標準化處理,再用『keras類神經網絡模型』預測分類

【5-4.進階處理問題2:使用【管道器封裝中間的全部流程:(x➜【管道器pipeline】➜y】來處理『數據要經過多種預處理所造成的繁雜易出錯』】

範例9-3.用『管道器pipeline』封裝『keras類神經網絡模型』,處理『客戶關係管理的客戶價值度RFM資料』並預測分類

【5-5.進階處理問題3:使用【獨熱編碼OneHotEncoder,變成獨立的多個向量欄位(1,0,0),(0,1,0)】來處理『有些欄位是類別格式object(無順序,且非二元),是不能夠直接轉成數值0,1,2的』】

範例10-5.用『管道器pipeline』封裝『sklearn的5種模型』,處理『IBM電信的客戶流失率資料集』並預測A客戶是否會流失

範例10-6.用『管道器pipeline』封裝『sklearn的5種模型』,處理『歐洲信用卡公司盜刷資料集』並預測A客戶是否會盜刷

【六,實作:網路客戶流量與行為的分析工具:GA(Google Analytics)】

資源
上課工具 線上黑板( Online blackboard) 廣播教學 上課錄影影片 Goole輸入法(Input:exe) NatureReader
證照考試:商用數據應用師 考試題庫 (從中約抽70題) 報名證照相關說明與方法 考試方式:100題單選題,每題1分,70分及格 考試指定用書
數據集,資料集,dataset UCI的各種資料集 Kaggle的各種資料集 考試方式:100題單選題,每題1分,70分及格 考試指定用書
上課參考教材 書籍:跨領域學 Python:資料科學基礎養成 書籍:Python 資料科學與人工智慧應用實務 書籍:一行指令學Python:用機器學習掌握人工智慧
書籍:用Pandas掌握商務大數據分析 進階書籍:Python商業數據分析:零售和電子商務案例 pandas官網(英文) w3schools的pandas教學(英文)
pandas參考教材 w3Cschool的pandas教學(中文) Steam教學網-python 蓋若pandas 教程 pandas的df的操作函數
colab繪圖如何顯示中文,方法1 ☎#colab顯示繁體中文,方法1 問題:matplotlib繪圖,會發生中文無法顯示的問題
參考:colab繪圖如何顯示中文
程式碼
#--------------------------------
# colab繪圖顯示繁體中文
#--------------------------------
import matplotlib
# 先下載台北黑體字型
!wget -O taipei_sans_tc_beta.ttf https://drive.google.com/uc?id=1eGAsTN1HBpJAkeVM57_C7ccp7hbgSz3_&export=download import matplotlib
# 新增字體
matplotlib.font_manager.fontManager.addfont('taipei_sans_tc_beta.ttf')
# 將 font-family 設為 Taipei Sans TC Beta
# 設定完後,之後的圖表都可以顯示中文了
matplotlib.rc('font', family='Taipei Sans TC Beta')
colab繪圖如何顯示中文,方法2 ☎#colab顯示繁體中文,方法2 ☎程式碼
#--------------------------------------
# 課本的中文處理
#--------------------------------------
import matplotlib as mpl
import matplotlib.font_manager as fm

!wget "https://www.wfonts.com/download/data/2014/06/01/simhei/simhei.zip"
!unzip "simhei.zip"
!rm "simhei.zip"

fm.fontManager.addfont('SimHei.ttf')
mpl.rc('font', family='SimHei')
# 這一行能讓字體變得清晰
%config InlineBackend.figure_format = 'retina'
windows的spyder繪圖如何顯示中文 ☎解決:windows的spyder,會發生中文無法顯示的問題
參考:windows繪圖如何顯示中文
程式碼
#在windows 10 的spyder,繪圖如何顯示中文
#使用微軟正黑體(Microsoft JhengHei)
plt.rcParams['font.sans-serif'] = ['Microsoft JhengHei']

#有些中文字體在碰到負號時,會無法正常顯示,尤其是內建的字體,加入以下語法就可以解決『負號無法顯示』問題
plt.rcParams['axes.unicode_minus'] = False
在colab如何更改目錄 ☎解決:在colab如何更改目錄的問題
程式碼
import os
os.chdir("/content/drive/MyDrive/Colab Notebooks")
!ls
解決簡體字csv造成亂碼 ☎解決簡體字csv,打開後都是亂碼的問題:

第2 種方式:
(1)先執行Excel 軟體,新增空白活頁簿,
(2)然後在上方功能選項中點選「資料」➜「取得外部資料」➜ 「從文字檔」 → 「選擇csv文件」,
選擇你的CSV 檔,
在「匯入字串精靈」對話框中選擇檔案原始格式65001:Unicode(UTF-8) 即可。

若是utf-8還是有亂碼,再改成
在「匯入字串精靈」對話框中選擇檔案原始格式54986:簡體中文(GB18080) 即可。

(3)打勾:我的資料有標題
(4)分隔符哈:逗號

程式模板 ☎存入excel檔案,並且畫柱狀圖
程式模板chp8-6.樞紐分析表的必要指令:展開 ☎輸出excel檔案:建立3個資料表sheet(英文成績,數學成績,中文成績)
打開chrome網頁線上英文字典功能 ☎如何安裝google chrome的網頁線上英文字典工具:
➜google chrome的右上角工具➜更多工具➜擴充功能
➜左上角主選單➜開啟chrome線上應用程式商店
➜勾選:google製作,免費
➜搜尋:google dictionary➜安裝
➜到chrome右上擴充功能➜點按google dictionary的『詳細資料』➜擴充功能選項
➜my language=chinese
➜打勾2個:Pop-up definitions:
(1)反白單字翻譯:Display pop-up when I double-click a word
(2)ctrl+拖曵整段翻譯: Display pop-up when I select a word or phrase

上課用excel 學生成績-chinese 學生成績-有缺值-chinese 學生成績-物理歷史-chinese 學生成績-amy-simon-chinese
學生成績-生日-chinese 學生成績-分組-chinese 人事資料-chinese 男女時薪-chinese
學生成績-english 學生成績-有缺值-english 學生成績-分組-english 圖書資料-chinese
上課用csv 小費tips-chinese 小費tips-english 學生成績-chinese 學生成績-english
圖書資料-chinese
上課用其它資料庫 mySQL-ch09 SQLite-student json-學生成績 xml-personnel
課本商業範例資料庫 商業銷售分析-sales csv 系所生源分析-excel 股市分析-台積電聯發科股票線型-excel 問卷資料分析-excel
pandas參考教材 十分鐘入門 Pandas(英文) 十分鐘入門 Pandas(英文) 10分鐘的Pandas入門-繁中版 十分鐘入門 Pandas(中文)
pandas參考教材 pandas官網全部章節翻譯 pandas官網全部章節翻譯
pandas參考教材(英文) kaggle pandas教學 100 pandas tricks to save you time and energy 官網0.22.0:pandas documentation
pandas參考教材(中文) Pandas 101:資料分析的基石 資料科學家的pandas 實戰手冊:掌握40 個實用 簡明 Python Pandas 入門教學 資料分析必懂的Pandas DataFrame處理雙維度資料方法
pandas速查手冊 pandas 速查手册 - 盖若 Pandas速查手冊中文版 - 知乎專欄 Pandas速查手冊中文版- 騰訊雲開發者社區
pandas速查手冊 Pandas中DataFrame基本函數整理(全) Pandas 魔法筆記(1)-常用招式總覽 pandas的df的操作函數
資料集dataset 小費資料集Tips Dataset(csv) kaggle小費資料集範例A Waiter's Tips example 【視覺化】小費(tips)資料集分析 小費(tips)資料集提取和檢視相應資料
SQL語法 SQL語法教程 pandas vs SQL
資料分析4大模組(runoob) numpy pandas matplotlib scipy
w3c、w3school、w3cschool、runoob、w3capi比較 runoob流量監控儀表板
w3school vs runoob 1.w3school中文版是直接google翻譯英文版
2.runoob.com翻譯自英文版w3schools,但重新排版
3.runoob = run + noob(菜鳥,小白)
4.runoob是python,html,javascript中文版最好的教學網
官網 python官網 vscode官網    
python 教學網站 python 3(官網手冊中文) python 3教學(中文) python 3教學(中文) 簡易1小時教學
w3school(英文版)      
線上執行python online

https://www.python.org/shell/(建議用這個)

https://repl.it/languages/python3


https://www.onlinegdb.com/online_python_compiler

https://www.tutorialspoint.com/execute_python_online.php

用Anacond寫python(*建議使用)

到Anacond官網下載安裝

作業(homework)
作業1
作業2