統計學變量的定義范文

時間:2023-07-10 17:19:58

導語:如何才能寫好一篇統計學變量的定義,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公文云整理的十篇范文,供你借鑒。

統計學變量的定義

篇1

[關鍵詞]教師職業倦怠 人口統計學變量 個性因素 組織因素

[中圖分類號] G451 [文獻標識碼] A [文章編號] 2095-3437(2013)15-0027-03

教師職業倦怠是教育研究中值得關注的一個問題。“教師是一個高壓力的職業,社會賦予教師的高度期望、繁重的工作量、學生行為問題、學生考試成績和課程與教學改革等都是教師壓力的主要來源。”[1]“過高的工作壓力和職業倦怠會導致教師工作績效下降、缺勤、離職,對教師的身心健康造成不利影響,并對學生產生直接、消極的影響,甚至波及整個社會。”[2]教師職業倦怠也因此成為教師專業發展的阻力和教師職業生涯中的危機。

一、職業倦怠的概念界定

對于職業倦怠的概念,不同學者從不同的角度提出了不同的看法,概括起來,不外乎兩大類,即側重揭示職業倦怠最終狀態的靜態定義和側重描述職業倦怠動態發展過程的動態定義。

(一)職業倦怠的靜態定義

Maslach認為,“職業倦怠是指那些需要連續不斷地與他人互動的人際服務業者在經歷長期壓力下的一種行為反應,它由情感衰竭(emotional exhaustion)、非人性化(depersonalization)和低個人成就感(reduced personal accomplishment)三個成分組成”。[3]

在眾多職業倦怠靜態定義中,得到學術界廣泛認同的當屬Maslach對職業倦怠的界定。由于Maslach及其同事所編制的職業倦怠量表――MBI的普遍使用,使這一定義成為目前最常用的職業倦怠標準化操作性定義。

(二)職業倦怠的動態定義

與Maslach不同,Cherniss則從職業倦怠動態發展過程的角度界定職業倦怠,并給出了職業倦怠的定義,這一定義屬于職業倦怠的動態定義。Cherniss認為,“職業倦怠是個體面對工作疲勞(strain)在態度和行為上消極變化的過程,可分為三個階段:第一階段為資源和需求的不平衡,即壓力階段;第二階段為即刻、短時的情緒緊張、疲勞和耗盡,即疲勞階段;第三階段包括一系列態度和行為的改變(如以疏離、機械的方式對待工作對象),即防御性應對(defensive coping)階段”。[4]

職業倦怠的靜態定義和動態定義并不是相互排斥的,相反,在一定意義上,兩類定義是互補關系,動態定義所描述的是靜態定義的前一個階段,靜態定義所描述的是動態定義的最后階段。

Schaufeli和Enzmann在研究了職業倦怠的諸多定義之后,最為全面地概括了職業倦怠現象的本質:“職業倦怠是一般個體所經驗的、一種與工作有關的持續、消極的心理狀態,它主要以精疲力竭為基本特征。職業倦怠表現為負性壓力(distress)、低效能感、動機下降以及態度和行為的消極改變。這一心理狀況是逐漸形成的,但卻在很長一段時間內不被個體所覺知。它起因于工作中目的與現實的互不協調。職業倦怠因其實質上是一種不適當的應對策略,往往會持續存在”。[5]這一定義首先將職業倦怠的諸多癥狀概括為一個核心特征――精疲力竭和四種一般表現,即負性壓力、低效能感、動機下降以及態度和行為的消極改變。其次,它強調未能實現的目標和不適當的應對策略是職業倦怠產生的前提條件。最后,它指出職業倦怠是一個逐步發展的過程。顯然,這一概念和其他諸多概念相比,明顯的優勢在于不僅描述了職業倦怠的一般癥狀表現、產生原因及發生范圍,而且具體指出了職業倦怠的核心特征和四個常見的伴隨特征。此外,該定義還強調了職業倦怠是一個逐漸發展的過程,并指出應對策略,在職業倦怠形成過程中具有重要的作用。

二、教師職業倦怠的影響因素

影響教師職業倦怠的因素眾多,概括起來主要分為人口統計學變量、個性變量和組織變量三大類。

(一)人口統計學變量

已有研究考察的人口統計學變量主要包括年齡與工作經驗、性別、學生級別、教育程度和婚姻狀況等。這些變量也與職業倦怠或多或少存在一定的相關。例如,多數研究表明,教師的年齡和工作經驗與職業倦怠呈負相關,所以,在教師職業生涯初期,容易出現職業倦怠;就性別而言,較為一致的結論是男教師的非人性化程度明顯高于女教師;從學生級別來看,多數研究顯示中學教師的職業倦怠程度要高于小學教師;有關婚姻狀況與職業倦怠關系的研究出現兩種結果:一種結果表明,已婚教師的職業倦怠水平低于未婚教師,而另一種結果則顯示,結婚與否和職業倦怠的相關性并不顯著。其他一些人口統計學變量,如教師職稱、任教科目、學校級別等與教師職業倦怠的關系,較難取得一致結論。

總之,人口統計學變量與教師職業倦怠的相關性較低,研究結果也不十分一致,有些研究并未發現顯著的相關關系,甚至還得出與多數研究相反的結論。由此可以看出,人口統計學變量雖然是影響教師職業倦怠的因素,但并不是主要的因素。

(二)個性因素

影響教師職業倦怠的個性因素主要有心理控制源、A型人格、大五人格、工作期望、應對策略、自我概念、自尊和自信、自我效能、人生意義等。通過對這些因素的研究,可以解釋為什么在相同或相似的工作環境和壓力下,個體經驗的職業倦怠程度會有所不同。

研究表明,心理控制源是職業倦怠的有效預測變量,外控教師因其將事件和成就歸因于他人或機遇,因而其職業倦怠程度要高于內控教師;A型人格的人由于個性爭強好勝,具有時間緊迫感和充滿成功的理想等特點,通常認為更容易產生職業倦怠;研究表明,大五人格中的神經質與職業倦怠的關系最為顯著;個體對組織、工作以及自身過高的期望也會影響其職業倦怠程度,過高的期望會增加職業倦怠的程度;研究表明,個體的自我概念、自尊和自信都與職業倦怠呈顯著的負相關;Leiter認為,職業倦怠是由于自我效能感出現危機所致,實證研究也證明了這一點;職業倦怠的存在主義理論認為,職業倦怠是由于個體在生活和工作中尋求存在意義的需要未能實現所致,有關人生意義與職業倦怠關系的量化研究也充分支持了這一觀點。

三、組織因素

組織因素成為影響教師職業倦怠的原因是職業倦怠是一個與工作有關的概念。工作壓力源以及其他組織水平上的變量是產生職業倦怠的可能原因,因此,這應該是我們重點關注的因素。

(一)學生問題行為

學生是教師工作的對象,學生的行為表現是影響教師壓力和職業倦怠的重要因素。很多實證研究均表明,學生在課堂的問題行為、不遵守紀律、態度冷漠是教師主要的壓力源,學生問題行為與教師職業倦怠呈正相關。Hoerr和West將學生問題行為分為兩類:一類是一般問題行為,即較常見的、可以被教師預知的、經常出現的行為;另一類是危機問題行為。他們發現,學生一般問題行為與情感衰竭、非人性化存在高相關,而學生的危機問題行為則只與非人性化維度相關。Friedman的研究結果表明,學生的不尊重(指學生不尊重老師和其他同學)和不用心(指學生學習考試不及格)等學生問題行為會增加教師的職業倦怠感。

(二)學校文化

教師的主要工作場所是學校,所以學校文化也是影響教師職業倦怠的因素之一。Leithwood、Menzies、Jantzi等人認為,如果學校的目標明確,學校給予教師一個不斷學習的環境,學校文化是合作、團結的,教師的職業倦怠水平就低;相反,在組織僵硬的學校里,教師的職業倦怠水平就高。因此,學校應形成一個團結、合作、不斷學習和相互支持的良好氛圍,學校管理應該人性化。

(三)工作負擔

大量研究表明,合理的工作量有利于降低教師的職業倦怠水平,相反,工作超負荷則會提高教師的職業倦怠水平。工作超負荷有質和量兩方面的含義。從量的方面來看,工作超負荷是指有過多的工作要求,而用太少的時間去完成任務。如繁重的備課、批改任務,過多的學生數量等。從質的方面來看,工作超負荷是指工作的復雜和困難程度大,例如學校要求教師的教學成績要在本地區排名第一。

(四)教師的自

以往的實證研究顯示,教師參與的自也是影響教師職業倦怠的一個重要因素。當教師在教學和學校管理等事務中擁有更大的參與自,教師的職業倦怠水平就低,而缺乏參與自會使教師的士氣、自尊和工作滿意度下降,進而提高職業倦怠水平。

(五)角色沖突和角色模糊

角色沖突和角色模糊也是影響教師職業倦怠的重要組織變量。當個體面對兩種沖突情境而又被期望做出角色行為時,角色沖突就會出現。當個體對其職業的權利、義務和責任缺乏明晰、一致的認識而感到無法勝任工作,或者面對不斷增加的復雜工作和較大的組織變革時,角色模糊就會產生。

大量的實證研究表明,角色沖突與情感衰竭、非人性化呈正相關,與個人成就感呈負相關,其中,角色模糊與個人成就感的關系最為密切。總之,角色沖突和角色模糊與教師職業倦怠都有較高的相關,但比較而言,角色沖突對教師職業倦怠的解釋能力相對較強。

(六)社會支持

社會支持通常從來源和類型兩個方面進行劃分。依據來源,社會支持可分為校內支持(包括同事支持、校長支持等)和校外支持(包括學生支持、朋友支持、配偶支持等)。依據類型,社會支持可分為信息支持、實際支持和情感支持三類。

一般而言,社會支持作為個體的一種應對方式,良好的社會支持能有效降低教師職業倦怠的程度,但因社會支持的結構較為復雜,不同類型的社會支持對教師職業倦怠的影響有所不同。例如,多數實證研究結果顯示,校內支持與教師職業倦怠的關系比較密切,其對教師職業倦怠各成分均有負向預測作用,而校外支持與教師職業倦怠的相關性并不顯著;情感支持能有效降低情感衰竭、非人性化;實際支持可以增強教師的個人成就感;教師的時間支持高,則情感衰竭和非人性化程度低。

個別學者的研究甚至得出相反的結論。例如Burke和Greenglass的一項研究結果顯示,社會支持對教師職業倦怠的影響并不顯著。Byrne認為,這可能是由社會支持理論結構的多維性和統計方法的多樣性造成的。

除以上因素之外,工作需求、工作資源、工作控制以及付出與回報不成比例等也是影響教師職業倦怠的因素。而在以上各組織因素中,學生的行為問題、角色沖突與角色模糊、教師的自主性、工作負擔是教師壓力的主要來源。

綜上所述,與教師職業倦怠有關的因素主要有人口統計學變量、個性變量和組織變量三類。其中,人口統計學變量相對比較穩定,它們與教師職業倦怠雖有相關關系,但不與教師職業倦怠有因果聯系。個性變量則比較主觀、多變,它們對教師職業倦怠的影響也比人口統計學變量要大。組織因素是屬于微系統或中系統層面,其與教師職業倦怠的相關程度也最高。

[ 參 考 文 獻 ]

[1] 周曉曄,秦巍.中學教師職業壓力調查分析[J].遼寧師范大學學報(社會科學版),2004,(3):69-71.

[2] Farber,B.A.Stress and burnout in the American teacher[M].San Francisco,CA:Jossey?鄄Bass,1991.

[3] Maslach,C.Burnout: A social psychological analysis.In J.W.Jone(Ed.),The burnout syndrome:Current research,theory,investigations[M].Park Ridge,IL:London House Press,1982.

[4] Cherniss,C..Professional bournout in human service organiz?鄄

ations[M].New York:Praeger,1980.

[5] Schaufeli,W.B.&Enamann,D..The burnout companion to stu?鄄

篇2

學生考試成績,作為一項衡量學生學習情況和教師授課效果的重要指標,在教學評價中起著舉足輕重的作用。隨著新課程改革的不斷推進和教育教學改革的不斷深入,對教學評價提出了更為客觀的要求,這就要求教師在對學生學習成績進行統計和評價的過程中必須借助于相關的統計學知識,從考試成績中充分挖掘出有意義的教學資源,達到事半功倍的效果。文章以我校2010屆高三理科兩個班級學生省質檢理綜成績為例,介紹如何應用SPSS統計軟件對考試成績進行分析和評價,以期為教學活動提供一定的幫助。

二、SPSS簡介

SPSS(Statistical Package for Social Sciences)即社會科學統計程序,是一款享有“世界優秀統計工具”之美譽的專業統計軟件,它和統計分析系統SAS(Statistical Analysis System)以及生物醫學程序BMDP(Biomedical Programs)并稱為國際上最具影響力的三大統計學軟件。SPSS可以用對話框的形式實現各種管理和分析數據的功能,擁有數據管理、統計分析、圖表分析和輸出管理等功能,從而實現描述性統計分析、均值比較和相關分析等分析功能。它具有操作簡便,統計分析方法全面,圖形繪制快捷等優點,作為一種有效的統計工具,SPSS已經廣泛應用于生物學、心理學和醫學等各個領域,近年來,SPSS在教育教學統計中也得到了越來越廣泛的應用。

三、應用SPSS統計軟件進行試卷分析

(一)數據收集和分析內容

1.調查對象

三明二中2010屆高三(8)、(9)班學生省質檢理綜成績。

2.成績分析內容

(1)試卷成績分析

主要包括,學生人數、參加考試人數、平均分、最高分、最低分、及格率、標準差和成績分布是否呈正態分布等。

(2)學生成績分析

比較高三(8)和(9)班,兩個不同班級的學生成績是否有差異,以及兩個班級男生和女生成績是否有差異。

(二)應用SPSS統計軟件進行試卷分析

首先可以將學生成績輸入Excel中,然后導入SPSS中,主要設置的變量包括編號、姓名、班級、性別、理綜成績等。數據處理操作步驟如下:

1.定義分數段

在成績分析時,為了更直觀地看出不同分數段學生人數及其所占比例,這里可以將分數轉換成分數段,SPSS中具體操作如下:點擊TransformRecode Into Different Variables(轉換重新定義不同變量),彈出Recode Into Different Variables(重新定義不同變量)對話框,把“理綜”成績這個變量輸入Output Variable(輸出變量)對話框中,在Name(名字)欄目中輸入“分數段”,單擊Change(改變);然后單擊Old and New value(舊的和新的值)按鈕,選擇Range(范圍),在其下欄目中輸入相對應的分數范圍,由于理綜總分為300分,180分代表及格,所以用0179.9,Value(值)中輸入50用來代表不及格的分數,單擊Add(添加);同理,我們可以定義60、70、80、90分段的分數段,如圖1所示。

圖1 定義分數段對話框示意圖

2.成績分析

以班級為單位進行試卷分析,繪制成績分布直方圖和Q-Q概率圖對本次理綜考試情況進行正態分布分析,具體操作步驟如下:單擊AnalyzeDescriptive StatisticsFrequencies(分析統計學描述頻數分析),在彈出的Frequencies(頻數分析)對話框中,把“理綜”和“分數段”兩個變量導入Variable(變量)中;點擊Statistics(統計)按鈕,在彈出的Frequencies:Statistics(頻數分析:統計)對話框中,選中Mean(平均分)、Std deviation(標準偏差)、Minimum(最低分)、Maximum(最高分)和Range(范圍)這五個常用指標,單擊Continue(繼續),返回主對話框,點擊Charts(繪圖)按鈕,在彈出的Frequencies:Charts(頻數分析:繪圖)對話框中,選中Histograms(柱狀圖)和其下的With normal curve(正態分布曲線),再點擊Continue(繼續),返回主對話框,點擊OK按鈕,就可以獲得學生總數、缺考人數、最高分、最低分、平均分、優、良、中、差和不及格人數分布及其百分百直方圖,統計結果如表1、表2和圖2所示。

表1 學生理綜成績基本統計情況

表2 學生理綜成績分布情況

教育學與統計學理論認為,一次難度適中信度可靠的考試,其成績分布應該接近正態分布(陳捷,2008),文章為了驗證本次理綜考試是否符合正態分布,采用Q-Q概率圖對考試成績進行正態分布分析,具體操作如下:執行Graphs(圖表)Q-Q,打開“Q-Q Polts”( “Q-Q 圖”)對話框,將“理綜”作為變量輸入Variabls(變量)中,其他采用系統默認選項,點擊OK按鈕,就可以得到學生理綜成績正態分布Q-Q概率圖,如圖3所示。

3、考試成績差異性比較

(1)不同班級之間學生理綜成績比較

執行AnalyzeCompare MeansIndependent-Samples T Test(分析比較方法獨立性T檢驗),在彈出的Independent-Samples T Test(獨立性T檢驗)對話框中,把“理綜”選入Test Variable(檢驗變量)對話框中,將“班級”選入Grouping Variable(分組變量)對話框中,單擊“Difine Groups”(分組)按鈕,在彈出的Difine Groups(分組)對話框中,在Groups1(第1組)中輸入8班;在Groups2(第2組)中輸入9班,點擊Continues(繼續)返回主對話框,單擊OK,完成比較,統計結果如表3、表4所示。

表3 不同班級學生理綜成績情況表

表4 不同班級學生理綜成績獨立樣本T檢驗

表5 男女學生理綜成績情況

(2)男女學生理綜成績比較

操作步驟同(1),得到統計結果如表5和表6所示。

表6 男女學生理綜成績獨立樣本T檢驗

四、結果分析

1.從表1可以得到,參加理綜考試的學生人數為107人,沒有缺考學生,平均分為211.55分,標準差為41.63,最高分為273分,最低分為85分,全距為188分。說明本次考試整體難度較高;標準差為41.63,最高分與最低分的差距為188分,說明這兩個班學生理綜水平兩極分化較大,這可能與學生對該學科的學習興趣有關。

2.從表2和圖2可知,大部分的學生集中在良、中和及格分數段,不及格的人數占到約20%,而優等分數段的學生僅有一人,主要是由于這兩個班級都是平行班,尖子生較少;此外,本次理綜考試的難度偏大導致及格率較低。而從圖3學生成績正態Q-Q概率圖看,盡管有一定數量的學生成績在趨勢線附近有波段,但從總體來看,基本還是呈直線分布,因此,本次理綜省質檢考試成績還是可以近似認為呈正態分布。

3.表3和表4顯示,高三(8)班和(9)班兩個班級學生理綜成績的平均分分別為213.91分和209.15分,雖然(8)班的平均分高于(9)班,但是兩個班級學生的成績沒有顯著差異(P=0.557>0.05);表5和表6結果顯示,兩個班級男女生的理綜成績平均值分別為211.36分和211.89分,男女生理綜成績沒有顯著差異(P=0.95>0.05)。

五、總結

篇3

關鍵詞:力量;影響;體育舞蹈

一、前言

體育舞蹈可以被描述為體育和藝術的特殊結合,是一種使舞蹈雙方,以原始的方式,通過不同的音樂類型和塑造協調復雜的優美舞姿來表達真實的情感。舞者的技術和藝術的質量性能取決于廣泛的機動能。一名舞者的技術和藝術表演水平取決于運動的寬譜能力.到目前為止在體育舞蹈方面的研究者已經向在一定舞蹈學科的技術表演領域的個人運動能力的增值上向一些有趣的消息屈服。同樣,許多研究也證實了舞蹈的基本運動能力對一支成功的舞蹈表達影響很大。鑒于舞蹈技術,即運動結構,在一般的舞蹈活動中,可以說最活躍的是身體的尾椎,它是移動的“基礎”。對于一個成功的舞蹈技巧主要負責執行任務的是舞者的下肢,肌肉和腹部。這種能力縮小他們的速度使他們得到放松,并決定著舞蹈表演中必要的力度,及時與特定的肌肉群發生相互的反應,影響舞者能量的合理利用,以及肌肉的顯現,很大程度上有助于移動性能的審美表達。力量這種運動能力在舞蹈活動中起著重要的作用。它出現在不同的表現形式中,舞蹈的活動類型決定著其潛力的效用水平。

本文的假設是:

假設一:基于被期望的肌肉運動力量能力對標準舞的表演和技術的效能進行統計上的重要預測。

假設二:基于被期望的肌肉運動力量能力對拉丁舞的表演和技術的效能進行統計上的重要預測。

二、研究方法

(一)樣品的參與者

使用了一個具有代表性和目的性的由49個包括25名女性和24名男性組成的體育舞蹈受訪者的分層抽樣。這個樣品包含初中1和初中2的從12歲到15歲年齡群的舞蹈者。他們作為舞蹈分派D3、D4的一部分,競爭的項目涵蓋了基本的編排組合和更復雜的舞蹈技術的元素。他們都積極參與了2年的訓練過程,每周訓練三次。

(二)樣本的變量

本研究的目的,一個預測變量(通過三個力量測試定義)和兩個標準變量(通過三支拉丁舞和三支標準舞定義)被選中。預測變量用于測試在拉丁舞和標準舞表演中的相關性和預測成功的可能性。它是由:1.上肢提升――MPGDT2.從躺的位置扔實心藥球――MBMLE;3.從現場跳――SKOKUDAL。預測變量是由標準化測試對運動強度的能力評價和他們具備必要的度量特性所組成。拉丁舞、和標準舞的標準變量都將被用于評估舞蹈結構習得的質量和速度。標準變量是分別由五支舞中的三支組成的。為了在動力學中將二者進行比較,在拉丁舞表演中,我們選擇了桑巴,恰恰恰和牛仔,從標準舞中我們選擇了華爾茲,探戈和快步來進行比較。這些變量當中的每支舞都被基礎技術元素所定義。綜上所述,這些變量包含一個標準的拉丁舞變量和一個標準的標準舞變量。所有的技術元素都已經被國際體育舞蹈聯合會――IDSF規定采用。拉丁舞和標準舞的基礎技術元素評估通過評審委員會使用打分制完成,打分范圍從0到10。評審委員會是由波斯尼亞和黑塞哥維那體育舞蹈聯合會得到許可的裁判組成。

(三)實驗描述

預測變量的標準化考試系統是由強度運動能力的評估:MPGDT,MBMLE SKOKUDAL組成的。這些測試具有一定的指標特性。測試標準變量是由驗證評審委員會來完成的,同時也負責評估舞蹈結構表演水平的0到10分的測量任務。所有分數的算術平均結果將把每個試驗者所得的分數放到拉丁舞和標準舞的水平評估量表里。

(四)統計數據處理研究的結果

從研究得到的結果以描述性對比統計分析程序處理。比較數據,我們采用參數統計,其中:相關性和回歸性分析。作為統計重要性水平,我們設置P

三、結果與討論

篇4

求相關系數r:相關系數介于區間[-1,1]內,相關系數是最早由統計學家卡爾·皮爾遜設計的統計指標,是研究變量之間線性相關程度的量,一般用字母r表示。由于研究對象的不同,相關系數有多種定義方式,較為常用的是皮爾遜相關系數。

相關表和相關圖可反映兩個變量之間的相互關系及其相關方向,但無法確切地表明兩個變量之間相關的程度。相關系數是用以反映變量之間相關關系密切程度的統計指標。相關系數是按積差方法計算,同樣以兩變量與各自平均值的離差為基礎,通過兩個離差相乘來反映兩變量之間相關程度;著重研究線性的單相關系數。

(來源:文章屋網 )

篇5

相關熱搜:統計學  統計學原理

一、數據統計分析的內涵

數據分析是指運用一定的分析方法對數據進行處理,從而獲得解決管理決策或營銷研究問題所需信息的過程。所謂的數據統計分析就是運用統計學的方法對數據進行處理。在實際的市場調研工作中,數據統計分析能使我們挖掘出數據中隱藏的信息,并以恰當的形式表現出來,并最終指導決策的制定。

二、數據統計分析的原則

(1)科學性。科學方法的顯著特征是數據的收集、分析和解釋的客觀性,數據統計分析作為市場調研的重要組成部分也要具有同其他科學方法一樣的客觀標準。(2)系統性。市場調研是一個周密策劃、精心組織、科學實施,并由一系列工作環節、步驟、活動和成果組成的過程,而不是單個資料的記錄、整理或分析活動。(3)針對性。就不同的數據統計分析方法而言,無論是基礎的分析方法還是高級的分析方法,都會有它的適用領域和局限性。(4)趨勢性。市場所處的環境是在不斷的變化過程中的,我們要以一種發展的眼光看待問題。(5)實用性。市場調研說到底是為企業決策服務的,而數據統計分析也同樣服務于此,在保證其專業性和科學性的同時也不能忽略其現實意義。

三、推論性統計分析方法

(1)方差分析。方差分析是檢驗多個總體均值是否相等的一種統計方法,它可以看作是t檢驗的一種擴展。它所研究的是分類型自變量對數值型因變量的影響,比如它們之間有沒有關聯性、關聯性的程度等,所采用的方法就是通過檢驗各個總體的均值是否相等來判斷分類型自變量對數值型因變量是否有顯著影響。(2)回歸分析。在數據統計分析中,存在著大量的一種變量隨著另一種變量的變化而變化的情況,這種對應的因果變化往往無法用精確的數學公式來描述,只有通過大量觀察數據的統計工作才能找到他們之間的關系和規律,解決這一問題的常用方法是回歸分析。回歸分析是從定量的角度對觀察數據進行分析、計算和歸納。

四、多元統計分析方法

篇6

1一般資料

1.1研究對象

選擇2007年11月到2009年4月在我院神經內科住院急性腦梗死患者共67名,平均年齡(55~84)歲,70歲以上16名,占23.9%,其中男41名(占61.2%),女性26名(占38.8%)。診斷均符合全國第四屆腦血管病學術會議修訂的診斷標準,并經頭部CT或MRI檢查證實,排除顱內出血或任何出血性神經系統病。所有病例除外改良RANKIN評分>4分(即排除嚴重失能的患者,臥床不起者,大小便失禁者和需要長期維持護理者),大腦靜脈血栓,外傷或手術史,急慢性炎癥,發熱、感染性疾病、肝腎功能不全(AST或ALT>3倍正常值上限,根據cockcroft公式計算出肌酐清除率<30ml/min),合并腫瘤、自身免疫性疾病、外傷、近期手術及服用糖皮質激素或免疫抑制劑者。其中51名(76.1%)患者合并高血壓病史,是主要的血管危險因素。

1.2主要實驗儀器

GEsignalLX1.5T磁共振成像設備、德國HERMLE離心機、美國GE8層CT機、韓國BIONET12導心電圖機、美國貝克曼庫爾德(BECKMANCOLTER)公司的IMMAGE型全自動生化分析儀、全自動血細胞分析儀、美國HELENA公司的快速電泳儀、貝林濁度分析儀,EDTA試管。

2研究方法

所有患者均經進行詳細的病史(高血壓病、冠心病、糖尿病、高脂血癥、腦血管病、吸煙史、教育水平)采集及神經系統檢查體格檢查,血壓、血常規、血糖、血脂、肝腎功能,尿酸,12導聯-心電圖,頭部CT或MRI等檢查。所有腦梗死患者于發病72h內測定HS-CRP,每3個月進行一次訪視,收集所有終點事件,隨訪1年。

2.1血管性危險因素和臨床變量

高血壓(收縮壓≥140mmhg或舒張壓≥90mmhg或正在服用降壓藥),糖尿病(治療過或已知空腹血糖≥7mmol/l),高膽固醇血癥(總膽固醇≥220mg/dl或正在服用降血脂藥),高甘油三脂血癥(甘油三酯≥190mg/dl或正在服用降脂藥),吸煙史(當前吸煙或過去6個月停止吸煙),冠心病史,腦血管病史。血清HS-CRP正常值為0~5mg/l,大于5mg/l定義為異常值(我院正常值范圍0~5mg/l)。

2.2腦梗死和終點事件的定義

腦梗死的定義為:有局灶性缺血性神經功能缺損;癥狀≥24h,或無論癥狀持續的時間,CT/MRI有相應的腦梗死證據。終點事件的定義為:任何原因的死亡(血管性和非血管性);任何新發的非致死性血管事件(包括復發的腦卒中、短暫性腦缺血發作、急性心肌梗死、不穩定型心絞痛)。

2.3改良RANKIN量表評分與病情程度

采用改良RANKIN量表評分評價患者的病情嚴重程度。所有入選患者都進行改良RANKIN量表評分(ModifiedRankinScale,mRS),本研究所有患者的評分在0~4分之間,評分0~2分被定義為輕度殘疾,3~4分被定義為中重度殘疾。

2.4采集血樣和超敏C反應蛋白的測定

入選的患者在合格事件發生后72h晨起空腹完成靜脈血樣采集,全血在3000rpm條件下離心15min后,分離出血清保存于-80℃等待分析。超敏C反應蛋白使用貝林濁度分析儀檢測,單位:mg/l。所有結果均進行復查。

3統計學處理

計量資料用均數±標準差(x±s)兩組計量資料的比較應用t檢驗,計數資料應用χ2檢驗。各自變量與終點事件的相關性應用單因素分析和多元線性逐步回歸分析。進入方程的變量包括:年齡、男性、高血壓、糖尿病、冠心病、腦血管病、高甘油三脂血癥、高膽固醇血癥、吸煙史、HS-CRP>5mg/l,終點事件(復發的卒中、其他血管事件和任何原因導致的死亡)作為應變量。Log-rank檢驗用于評價HS-CRP增高組(HS-CRP>5mg/l)和HS-CRP正常組(HS-CRP≤5mg/l)之間的關系,P<0.05為差異有統計學意義。數據采用SPSS13.0軟件進行統計學處理。

4結果

4.1患者的一般情況及HS-CRP測定結果的分析

兩組在性別、年齡、文化水平、及血管危險因素或既往史(高血壓病史、糖尿病史、高膽固醇血癥、高甘油三脂血癥、吸煙史、冠心病史、腦血管病史)之間沒有統計學差異(P>0.05)(見表1)。HS-CRP的水平與患者的年齡、性別、受教育水平、血管常見危險因素及既往史沒有明確的關系。

4.2終點事件相關危險因素分析

4.2.1單因素分析隨訪1年的時間中,所有患者都服用抗血小板類藥物進行預防,每3個月隨訪一次收集和記錄所有不良事件。共發生20例(29.9%)終點事件,其中包括腦梗死10例,短暫性腦缺血發作3例;冠心病5例;死亡2例(分別死于腦出血和胰腺癌)。各變量與發生終點事件的單因素分析(見表2)。其中HS-CRP>5mg/l是發生終點事件的危險因素,差異有統計學意義(P<0.05)。

4.2.2多因素分析根據單因素分析結果,采用逐步引入法將所有自變量引入logistic回歸方程,運算結果(見表3),最終HS-CRP進入方程中。HS-CRP增高組終點事件發生率明顯高于HS-CRP正常組,差異具有統計學意義(P<0.05)4.3HS-CRP與改良RANKIN量表評分(mRS)的關系所有患者入選時都進行改良RANKIN量表評分,mRS分為6個等級(0~6分)用于評價神經功能喪失程度。本研究67例患者中47例患者評分≤2分,12例患者評分3分,8例患者評分4分。mRs評分3~4分的患者的HS-CRP中位數水平明顯高于0~2分的患者,差異有統計學意義(P<05)(見圖2)。

5討論

盡管腦梗死的治療在過去的十幾年時間有了很大的提高,但是,1年內發生死亡和血管事件的風險仍很高。因此,探討預測腦梗死預后的指標,有很大的臨床應用價值。近年來,心腦血管缺血性疾病與血漿炎癥指標的相關性成為研究的熱點。近年研究發現,CRP直接參與了動脈粥樣硬化的過程[2]。CRP是一種炎癥急性時相反應物,主要在肝臟內合成分泌,受細胞介素-6(IL-6)刺激產生。動脈粥樣硬化是一種周身性的慢性炎癥,這種炎癥與血管內皮細胞破壞、血管功能的異常、脂質代謝異常有關。流行病學研究顯示血漿HS-CRP水平升高人群的心血管疾病的危險顯著增加,且心血管疾病患者HS-CRP水平與其預后密切相關。然而有研究中發現腦卒中患者HS-CRP水平升高與腦卒中的嚴重程度相關而非與再發心腦血管事件相關[3]。超敏CRP可檢測出0.2~10mg/l的CRP濃度,在這個水平上測定的CRP目前已代替其他炎癥因子(如IL-6和TNF-α)。呂雅麗等[4]搜集CRP水平對急性腦梗死預后影響非隨機對照研究,進行Mate分析,結果提示發病時CRP的水平可以初步評價腦梗死患者的預后。

本研究為前瞻性隊列研究,目的是了解腦梗死風險指標與腦梗死后一段時間內預后的關系。國內的報道多針對缺血性腦血管病后1個月內的短期預后,而我們的研究針對腦梗死后1年內的遠期預后。因為腦梗死各風險指標的作用是預測再發缺血性血管病變,所以我們關心的問題是該指標及危險因素與再發缺血性血管病變的關系,故將其定義為終點事件。另外,我們參照目前國際上此類文章的方法將死亡也定義為終點事件。為了排除其他因素度終點事件的影響,本研究還應用了多因素邏輯回歸分析,該方法不但除外了非研究因素的影響,而且除外了各風險指標之間的疊加作用。風險指標中僅有HS-CRP增高(即HS-CRP>5mg/l)與終點事件的發生密切相關,而與其他危險因素和既往史無關。

本研究表明,HS-CRP可能是腦梗死后1年內死亡及再發缺血性血管病的獨立預測指標,可以用來預測不良的預后。國外資料報道,CRP水平與缺血性腦血管病的預后密切相關,CRP水平升高,特別是持續升高者預后不良,不僅病死率高,而且功能恢復也很差[5]。本研究結果同時顯示,終點事件的發生與HS-CRP的水平呈正相關性,在血清HS-CRP>5mg/l的患者中,終點事件的發生比HS-CRP≤5mg/l的患者多,提示血清HS-CRP>5mg/l的患者炎癥反應較強,動脈硬化更嚴重,這與國外報道相似[6]。可能由于CRP水平增高,導致血小板的凝集和釋放功能異常,從而影響止血和凝血過程。有研究表明,凝血因子的啟動可增加腦卒中患者的患病率和死亡率。另外,本研究結果顯示,mRS評分(3~4分)的患者HS-CRP中位數水平比mRS評分(0~2分)的患者更高,表明HS-CRP水平可以反映腦梗死患者神經損傷的嚴重程度。這可能是CRP水平增高使與缺血性腦血管病病理相關的炎性反應程度較強,加速了梗死區半暗帶的惡化,進而加重了腦損傷。基于以上的結論可以對于HS-CRP增高的患者進行更加積極的預防,包括非藥物干預和藥物治療兩種方法。非藥物干預包括:減肥、飲食、運動和戒煙[7,8]。藥物治療可選藥物有:阿司匹林[9,10]、他汀類[11-13]和ACEI類[14],他們都能降低CRP的水平。可根據患者的具體情況選擇合理的治療措施。

篇7

2002年1月,隆冬的戶外,寒風凜冽。北京延慶的賓館內,來自某工廠的全體BB(六西格瑪黑帶)和包括總經理在內的各級干部正在分組討論年度六西格瑪課題戰略。第二天,一行人頭戴印有六西格瑪標志的帽子,頂著寒風,高舉代表各個課題隊的鮮艷旗幟攀登上了雄偉壯麗的八達嶺長城,揭開了2002年六西格瑪活動的序幕。

【背景】這是一家顯像管制造企業,也是最早在業內推行六西格瑪的企業之一,每年有兩次這樣的六西格瑪選題活動。在選題會上,依據公司確定的年度經營目標層層分解,擬定出為實現該目標而必須進行的課題,然后將眾多的課題按照重要程度分類,并分配給合適的人員。

作為2002年的重點工作之一,就是攻克顯像管異物發生的難題。眾所周知,異物是顯像管生產的天敵,管內異物是導致退貨的最根本原因。在以前,為了降低不良品率,工廠特別設置了一個三檢班,即實施出廠前第三次全檢,然而仍然有大量的不良品流出到客戶手中。

單純依賴檢驗僅僅能夠做到事后補救,但不解決根本問題,最根本的解決之道就是消除缺陷的發生源。因此,在年度選題會上,減少管內異物的發生率被作為一個六西格瑪黑帶課題進行討論。解決了這一問題,不僅可以大幅度節約修理成本,對于維護公司的品質形象和提高市場占有率也有顯著的作用。

一、定義階段

定義階段是以客戶的需求為依據,尋找問題點或改善機會的一個階段。如同公安機關的立案活動,這個案件的重要性如何,是普通的民事糾紛,還是刑事案件?案情復雜嗎?是需要成立專案組重點偵查,還是普通的業務處理?這就是六西格瑪課題的定義過程。

2002年1月13日,課題正式進入定義階段。在明確了品質要害點(CTQ)后,成立了項目組,確定項目的目標和范圍,以及為改善活動確立時間計劃表。

1.課題選擇

異物的不良發生率在企業里一直居高不下,每月因異物堵孔導致的修理費用近50萬元之多。在2002年1月5日的干部會議上,總經理指出2002年是向異物宣戰的一年,要建立起完善的異物管理系統,徹底減少管內異物,確保世界模范工廠的地位并贏得顧客的信任。

陳述課題選擇的理由,說明為什么該課題被認為是重要的,以及是否獲得了領導的支持,還可以從該課題同公司或部門戰略的關聯程度上表達。應用圖表的方式能夠更為直接地傳遞信息,有利于課題團隊成員的彼此交流和向上級報告。

2.把握顧客需求

站在外部顧客和內部顧客的角度上看待問題,分析外部顧客的意見和內部顧客的意見,正確地把握顧客最關心的問題,即。

3.把握問題的水準

經統計從2001年11月至2002年1月間的三個月內的堵孔平均發生率為1.57%,修理后品質信賴度差,工程處于一種極不穩定的狀態,經常出現品質事故,造成批量不良。應用排列圖方法對堵孔解剖后的數據進行分析后表明,金屬異物、銹、焊接異物、熒光粉、石墨是產生堵孔的最主要因素,尤其是金屬毛刺,因此應強化金屬部件入庫品質和脫脂管理。

把握問題的水準時要觀察一段期間內的歷史數據,最好是最近的3~6個月的數據。應用控制圖來代替傳統的趨勢圖,既可以看出隨時間的發展趨勢,也可以看出該過程的受控狀態。本例中應用的是單值控制圖。

4.設定課題目標及范圍

參照以往的歷史數據,對比同行業內的其他工廠水平,團隊成員們為本課題設定了一個挑戰性的目標,即堵孔發生率減半,到2002年6月份計劃達到0.8%,目前的基準水平為1.57%。研究范圍界定為機工部品的加工工程、電子槍制造工程和封接除塵工程。

5.形成課題隊

以本課題的擔當黑帶為首組成了一個跨職能的工作團隊,界定了團隊中每位成員在課題中的作用和任務。

做課題最忌諱的就是單打獨斗和不能有效地集中團體的智慧,因此,對黑帶來說,其項目領導能力和個人溝通技巧極為關鍵。團隊成員一般在6~7人,業務和技能方面互補。

6.預估課題效果和制定課題計劃

一個課題的解決會帶來很多綜合性的效果,包括有形的和無形的效果,然而可以計算出來的有形財務效果更具有說服力,也更容易獲得領導的支持。顯像管發生異物性堵孔后必須經過修理,修理單價為A,年產量為B,達到預期改善目標后的發生率下降為0.77%(1.57%-0.8%),按照年計算的預估效果金額為A×B×0.77%=320萬元。

最后就是利用甘特圖法,為課題的各個階段制訂較為詳盡的工作計劃。

二、測量階段

這個階段是查找嫌疑犯的過程,立案后的第一件事情就是查找所有可能的線索,不放過任何蛛絲馬跡。專案組的組長也就是六西格瑪黑帶(BB),召集了全體成員分析案情,大家把所有和這個案子相關聯的事物一一羅列。

六西格瑪相信的是有因即有果,這樣的一個因果關系我們可以用數學上的函數模型來表達,即Y=F(X),每一個課題總能歸結為一個的簡單方程:Y=f(X1,X2,…,Xk),測量階段所要尋找的就是這一個個的X,我們也把它稱為原因變量或輸入變量,而Y則稱為結果變量或輸出變量。大家運用頭腦風暴法暢所欲言,如果可能性低或關聯性不大會在后續的過程中利用經驗和證據將它排除掉,但前提是你必須先把它列入你的排查和搜索范圍。

課題進入到測量階段,主要進行三件事情,第一是明確關鍵的輸入和輸出變量,第二是進行基礎測量系統的研究,也就是驗證一下你所得到的數據可靠性如何,第三是對短期工程能力的分析研究,其中最重要的工作就是篩選出對結果Y起決定作用的X’s,為后續在分析階段進一步分析X和Y之間的關系并建立數學模型F提供輸入。

1.測量Y及其工程能力

六西格瑪課題的Y就是我們要研究和解決的問題,也就是顧客最關心的事情。在這個課題里所定義的Y就是綜檢Mask堵孔不良,計算公式是:

Y(綜檢Mask堵孔不良)=(綜檢堵孔不良數/綜檢作業數)×100%

然后根據公式定義小y(y1、y2……),它是構成大Y的缺陷分類,不是產生結果Y的原因X。對缺陷的分類定義,甚至在必要的時候還要用圖示說明,以統一對缺陷定義的一致性。在此課題里Y=y1+y2+y3+y4+y5+y6+y7+y8,其中分類是這樣的:

y1:金屬異物堵孔;y2:黑化皮膜堵孔;y3:焊接異物堵孔;y4:燃燒類異物堵孔;y5:AL膜堵孔;y6:GLASS碎片堵孔;y7:熒光粉堵孔;y8:電子槍異物堵孔。

初學者最難以區分的就是X和Y。據統計,40%以上的課題失敗是因為一開始就沒有選擇好課題以及清楚明確地對Y進行定義。

按照設定的管理規格計算出Y的工程能力Cpk=-0.51,表明現在的工程能力遠不能滿足客戶需求。

2.測量系統分析

但是,我們對于問題現狀的把握數據可靠嗎?萬一出現錯誤,如同將自殺被判斷成他殺,這將直接導致我們的行動失誤,因此必須經過檢驗。

4月14日課題組準備了10個測試樣本,這10個樣本中既有良品也有不良品,然后安排4個檢驗員進行判斷,每人測量3次。根據判斷結果的一致性來確定測量系統的可靠性,分析結論是,該測量系統穩定可靠,誤差水平可以接受。

在進行測量系統分析的時候,一定要注意隨機化和盲測,即10個樣本不能讓被測試者注意到明顯的識別方式以確保隨機,每一次測試前都要打亂順序,隨機抽取;第二不要讓被測試者在一次測試內重復檢測同一樣本,而是在一次測完10個樣本后換另外一個被測試者。

3.發掘并篩選潛在的原因變量

從哪些方面尋找破案線索或原因變量呢?工程繪圖是個好方法。按照課題選定的流程范圍,從人機料法環測(即5M1E)等幾個方面,羅列出所有可能的影響因子,然后進行篩選。

案情迷茫,線索重重,從哪兒開始調查?哪一條線索更有價值呢?六西格瑪提供了幾個簡單有效的篩選和評價工具,可以幫助我們把有限的資源和精力集中在最容易產生突破效果的線索上。在這個課題中首先應用了因果矩陣法,緊接著應用了失敗模式影響法對所有潛在的原因變量進行篩選,從而縮小包圍圈,快速聚焦于核心因子(犯罪嫌疑人)。

篩選出比較重要的輸入變量為脫脂液污染度、脫脂時間、B/P除塵噴嘴污染度、脫脂U/S強度、B/P除塵AIR壓力、B/P除塵U/S強度等共計18個因子。

因果矩陣的左邊兩列輸入的是來自于工程繪圖選定的工藝流程及其輸入變量(流程的關鍵工藝),橫排的關鍵輸出列出的是顧客最關心的小Y,最頂端的一行是評價小y對顧客的重要度(從1~10評分),其重要度的評價不能隨意,要參考定義階段的排列圖表現并經過團隊的綜合評價后給出。交叉格內的數字表達的是工程輸入變量對于關鍵輸出變量的影響度,判分標準為(0,1,3,9),影響度很大,給9分,影響度低則給1分,沒有影響給0分。比如脫脂黑化流程中脫脂液污染與金屬異物堵孔的影響程度為9。最右列的合計數字是每個輸入變量的影響度乘以對應關鍵輸出變量的重要度之和。經過電腦EXCEL表格運算后,按照合計分值的大小重新排序。通常選擇排在前10~15位的因子為第一次的篩選結果。這些因子隨后被作為了失敗模式影響分析的輸入而進行第二次篩選。

2002年2月20日,課題組的成員對前期的工作進行回顧,聽完課題黑帶的項目進展報告后,由黑帶主持進行第一次的潛在失敗模式影響分析。經過分析研究,對于一些能夠立即改善的事項擬定出對策和改善期限后各自分頭實施。

經過一段時間的改善和鞏固后,課題組成員再次聚集在一起進行失敗模式影響分析,根據風險優先數的排序結果,篩選出如下5個最重要的原因變量。這就好比破案根據線索找出具體的目標嫌疑人:

X1=黑化爐溫度

X2=B/P除塵噴嘴轉速RPM

X3=MASK焊接壓力

X4=B/P除塵U/S強度

X5=脫脂U/S強度

三、分析階段

課題進展到現在,已經篩選出來5個關鍵的輸入變量,它們是如何對結果產生影響的呢?首先需要分析嫌疑犯的犯罪經過。進入到分析階段,主要是搜集數據,了解潛在的原因變量對結果是如何發生作用的。在這一階段應用了不少的統計工具,如假設檢驗等工具盡管復雜,但是Minitab軟件可以幫助我們很輕松地實現。

1.多變量的主效果分析

法律尊重事實,六西格瑪用數據說話。為了有效地收集數據,課題組成員重新設計了數據收集表格,按照日期、機種、黑化爐溫度、焊接壓力、B/P除塵U/S強度、B/P除塵噴嘴轉速RPM等因素進行層別和記錄,將收集來數據輸入Minitab的分析工具表中,應用主效果分析圖表明:黑化爐溫度、蔭罩焊接壓力、B/P除塵U/S強度、B/P噴嘴轉速RPM對堵孔率似乎有比較明顯的影響,但仍需應用統計分析方法確認數據的信賴性。

2.統計分析中的假設檢驗

統計分析方法可以最大限度地減少主觀判斷的不確定性,或者說將主觀判斷的風險降到最低限度。例如嫌疑犯是否真的有罪?假設檢驗就是在沒有確定的證據之前假設罪犯是無辜的,這叫做疑罪從無,建立假設后尋找證據支持或假設。如果不是這樣,則將會產生個人的主觀臆斷,或者說你相信他有罪,你的主觀意識中就會去尋找一切支持他有罪的證據,這叫做有罪推定。

本課題針對在測量階段確定的5個關鍵輸入變量逐一進行分析,從統計信賴性上驗證其對結果的影響,并實施改善。

例如,課題組安排了3名倒班員工記錄在自然狀態下的黑化爐溫度和蔭罩堵孔發生率狀況,然后建立假設和分析。應用工程能力分析法,可以看出黑化爐的溫度對結果的影響較大,Cpk只有0.07,經研究后采取了如下三條主要措施:

1)預熱區間加熱器增加,增大加熱功率,保證加熱能力。

2)脫脂干燥區間延長,改善干燥狀態,同時提高部件入爐前溫度。

3)黑化爐保溫系統保全,減少爐內熱量散失。

改善后工程能力提高到了0.57。同樣的分析方法被應用于關鍵因子X2、X3和X4的分析及改善上。經過多次改善后,工程的穩定性良好,自5月份中期蔭罩堵孔發生率接近1%。

四、改善階段

找出了犯罪嫌疑人,但是對于團伙作案他們之間是什么樣的關系我們必須明確,這樣才能找出主犯和從犯。在這個課題中,有影響的關鍵因子X已經確定了,那么如方程式Y=F(X)中的X取什么值才能使得Y有最佳的表現?多個因子X之間又往往互相影響,應用實驗計劃法就是為了在復雜的交互作用條件下尋求關鍵因子的最佳取值。本課題中,應用響應表面法(RSM)分析B/P除塵強度、B/P噴嘴轉速得出保證效果的最佳條件為,B/P除塵強度:26±4G;B/P噴嘴轉速:34±3RPM。

五、控制階段

這一階段是維持管理的階段,擬定控制計劃(Control Plan),實施日常管理,將課程全階段的研究成果納入公司的標準管理體系,應用標準來穩定和固化前期的改善成果,并檢驗課題的效果。

自實施改善以來,堵孔發生率逐月下降,6月份以后的平均值為0.79%,達到了課題開始之前設定的目標。Y的工程能力也提高到了1.0。

【實施效果】該課題完成后,經過六西格瑪推進委員的財務效果分析師(FEA)進行驗證,達到了課題目標,按年間效果金額進行計算,可為公司節約費用310萬元,同時,本課題被集團公司評為二等獎,其他工廠也紛紛前來取經。

六西格瑪雖然應用了大量的統計學原理,但是學習六西格瑪完全不同于學習統計學,更多的時候,你只要知道如何按照規定的格式要求把相應的數據輸入電腦,能夠讀懂結果和進行判斷就足矣,一旦陷入統計學的迷宮往往就會偏離你解決問題的方向。當然,擁有深厚的統計理論基礎,對于知其所以然并判斷數據的信賴性有很大的幫助。

篇8

關鍵詞:多點地質統計學 訓練圖像 儲層建模

一、多點地質統計學與訓練圖像

基于變差函數的傳統地質統計學隨機模擬是目前儲層非均質性模擬的常用方法。然而,變差函數只能建立空間兩點之間的相關性,難于描述具有復雜空間結構和幾何形態的地質體的連續性和變異性。

針對這一問題,多點地質統計學方法應運而生。該方法著重表達空間中多點之間的相關性,能夠有效克服傳統地質統計學在描述空間形態較復雜的地質體方面的不足。多點地質統計學的基本工具是訓練圖像,其地位相當于傳統地質統計學中的變差函數。對于沉積相建模而言,訓練圖像相當于定量的相模式,實質上就是一個包含有相接觸關系的數字化先驗地質模型,其中包含的相接觸關系是建模者認為一定存在于實際儲層中的。

二、地質概念模型轉換成圖像訓練

地質工作人員擅于根據自己的先驗認識、專業知識或現有的類比數據庫來建立儲層的概念模型。當地質工作人員認為某些特定的概念模型可以反映實際儲層的沉積微相接觸關系時,這些概念模型就可以轉換或直接作為訓練圖像來使用。利用訓練圖像整合先驗地質認識,并在儲層建模過程中引導井間相的預測,是多點地質統計學模擬的一個突破性貢獻。

可以將訓練圖像看作是一個顯示空間中相分布模式的定量且直觀的先驗模型。地質解釋成果圖、遙感數據或手繪草圖都可以作為訓練圖像或建立訓練圖像的要素來使用。理想狀態下,應當建立一個訓練圖像庫,這樣一來建模人員就可以直接選取和使用那些包含目標儲層典型沉積模式的訓練圖像,而不需要每次都重新制作訓練圖像。

三、多點模擬原理

進行多點模擬,需要使用地質統計學中的序貫模擬。但是,多點模擬與傳統的基于變差函數的兩點模擬是不同的。在傳統地質統計學中,我們假設空間變量服從多元高斯分布,這樣,確定每一個網格單元條件分布的均值和方差,就相當于求解一個克里金方程組。而在多點模擬中,條件分布是直接通過掃描訓練圖像得到的。假設現在有一個儲層已被離散成N=Nx*Ny個單元格,其屬性用隨機函數{Z(x)|x儲層}來表示。那么,顯然變量Z的分布完全由N個變量的聯合分布所控制:

利用序貫分解,可以將這個N維的聯合分布分解為一系列條件分布:

序貫模擬算法的具體步驟如下:

1.定義一個用于訪問所有節點隨機路徑;

2.對每一個節點i=1,2,…,N 執行

2.1利用前期得到的i-1個抽樣,對條件分布進行模擬;

2.2從上面的條件分布模擬結果中抽取一個結果。

持續這一進程直到所有節點都被訪問到,這時就生成了一個模擬實現。通過定義另一個隨機路徑,可以得到新的模擬實現。這一序貫多點模擬算法被命名為SNESIM(Single Normal Equation SIMulation)算法。

四、多點與兩點地質統計學之間的理論聯系

可以通過一個簡單的例子了解多點與兩點地質統計學之間的關系:

給定3個已知數據I1、I2、I3,估計位置處的砂巖概率(圖1)。

在兩點統計學中,這相當于利用三個已知量的線性組合來估計未知量的條件期望:

上式可以近似的寫作:

通過求解、、、四個系數,可以確定未知量的條件期望。但是在確定未知量條件期望的過程中,無論是使用變差函數求取兩點的相關性,還是使用協方差來求取二階矩,每次只能使用三個已知數據中的兩個,而無法同時使用三個已知量。

全面、準確的條件期望的表達式應當是:

這個含有非線性項的表達式中將三個已知量都包括在內,同時也有更多的系數需要求解。與求解四個系數的方程組類似,這里需要求解一個包含八個方程的方程組,這些方程被稱為標準方程。引入非線性項的一個顯著后果是標準方程中出現了高階統計量。由于通過稀疏數據難以推斷高階統計量,因此不可能解出所有的標準方程。但是,我們可以引入一個給定的數據事件,并應用貝葉斯法則來計算條件期望:

其中A代表處為砂巖的數據事件,即;B代表數據事件。可以通過掃描訓練圖像,統計數據事件B重復出現的次數以及這些重復中為砂巖的概率來計算條件期望:

這一公式是SNESIM算法的核心。可以看出多點地質統計學在再現高度非線性空間結構方面明顯優于基于變差函數理論的傳統兩點地質統計學。

五、結論

將更多的地質資料整合到儲層建模過程中以確保最終數值模型更加符合地質認識,這在預測儲層流體特征時是十分必要的。多點地質統計學為地質工作者提供了一個強大的工具,使得他們可以通過訓練圖像將概念模型和先驗地質認識整合到建模過程中。

目前研究的重點是提高多點模擬算法的性能,包括:提高運行速度,降低內存開銷,提高沉積模式再現效果以及更靈活的整合不同來源的信息等。有理由相信,隨著多點建模方法不斷趨于主流,以及越來越多的地質工作者對這一方法變得熟悉,多點地質統計學將成為下一代地質建模工具。

參考文獻

[1] 王家華等. 克里金地質繪圖技術——計算機的模型和算法[M]. 1. 北京:石油工業出版社, 1999 :1-3.

[2] 王家華, 陳濤. 儲層沉積相多點地質統計學建模方法[J]. 石油化工應用, 2013, 32(8):57-59.

[3] 張團峰. 在儲層建模中利用多點地質統計學整合地質概念模型及其解釋 [J]. 地學前沿, 2008, 15(1):26-34.

[4] André G. Journel. Geostatistics: Roadblocks and Challenges[J]. Quantitative Geology and Geostatistics, 1993(5):213-224.

篇9

[關鍵詞] 市場營銷 統計分析 市場細分 市場定價

一、統計分析的特點

1.以統計數據為依據,利用統計數據說話

2.定量分析定性分析相結合

3.統計分析方法具有特殊性

4.統計分析的對象具有綜合性

5.統計分析的范圍具有廣泛性

二、市場細分與統計方法

面對市場競爭環境的日趨激烈,產品或品牌的日益復雜化,許多企業都意識到不可能依靠單一產品滿足所有的消費者需求。因此,如何審視市場特征、判別消費者需求,是企業的產品或品牌能否取得成功的關鍵因素。

1.市場細分的概念

市場細分是按照消費者欲望與需求把一個總體市場劃分為若干具有共同特征的子市場的過程。分屬于同一細分市場的消費者,他們的需要和欲望極為相似,分屬于不同細分市場的消費者對同一產品的需要和欲望存在著明顯的差別因此,企業必須知道哪些客戶對自己是最有價值的,他們的具體需求是什么,如何才能接近他們――市場細分的目的就是把需求大體相似的消費者劃歸為同一群體,從而以相應的商品和服務去滿足該群體消費者的需求。

2.統計方法在市場細分中的應用

從市場細分的程序來看,市場細分的基本觀念是,通過統計方法,在基礎變量(如消費者的性別、年齡等)和行為變量(如對產品的購買率)之間建立某種聯系。因此,對基礎變量的選擇、建立變量間聯系的方法成為細分研究成敗的關鍵,在選擇細分變量時可以采用統計學的因子分析模型。其基本目的就是用少數幾個因子去描述許多指標或因素之間的聯系,即將相關比較密切的幾個變量歸在同一類中,每一類變量就成為一個因子,以較少的幾個因子反映原材料的大部分信息。使用因子分析檢驗數據,可以剔除相關性很大的變量。這就可以為市場細分中產生綜合變數提供可能性,根據每個因子的方差貢獻率大小排序,只選擇方差貢獻率大的前幾位因子,作為細分的重要綜合變數,這樣就實現了只提取少數市場細分有重要影響的變數作為細分變數的目的,使得市場細分具有可操作性。

三、客戶滿意度與統計方法

1.客戶滿意度的含義

客戶滿意是一種心理活動,是顧客的需求被滿足后的愉悅感。客戶滿意度可以簡要地定義為:顧客接受產品和服務的實際感受與其期望值比較的程度。即顧客的可感知的效果與期望匹配,就會滿意,超過了就會高度滿意。這個定義既體現了顧客滿意的程度,也反映出企業提供的產品或服務滿足顧客需求的成效。

2.統計方法在客戶滿意度測評中的應用

弄清楚了顧客滿意產生的機理,我們就可以借助統計學的工具對顧客滿意度進行測量,為企業決策服務。而要測量顧客滿意,就必須有一套衡量、評價、提高顧客滿意度的科學指標體系。一般地在進行顧客滿意指標體系建立時,主要可以分為四個步驟:

(1)提出問題。進行顧客滿意指標體系建設的第一步,就是要明確影響顧客滿意的因素有哪些,同時還必須考慮如何將這些因素獲得與量化,即包括對下面幾個問題的回答:影響購買和使用的顧客滿意因素有哪些?在這些滿意因素中,哪些因素能為成為滿意指標?每一個滿意指標對購買和使用的影響程度如何?上述數據可以從哪些渠道獲得?應該采用何種方式采集數據?采集數據時應注意哪些問題?

(2)采集數據。采集數據的方法有很多種,建立不同的顧客滿意指標體系所側重的采集方法不同。在顧客滿意指標體系建立過程中采用的方法主要包括:二手資料收集、內部訪談、問卷調查、深度訪談和焦點訪談。

(3)建立行業顧客滿意因素體系。通過分析、整理收集到的二手資料和內部(外部)訪談所獲得信息,建立顧客滿意因素體系表。對各類指標的屬性進行充分分解,則初步建立起顧客滿意因素集合,為下一步展開數據收集工作提供調研目標。建立起來的行業顧客滿意因素體系包含了幾乎所有可能影響顧客滿意指數的指標,多數都以三級或四級指標的形式表現出來。

四、市場定價與統計方法

1.市場定價的方法

定價方法有成本導向、競爭導向、需求導向三種。成本導向定價指按開發成本和人為訂立的利潤比率確定價格。競爭導向定價法是指企業通過研究競爭對手的生產條件、服務狀況、價格水平等因素,依據自身的競爭實力,參考成本和供求狀況來確定同類產品的價格。需求導向定價是以消費者的認知價值、需求強度及對價格的承受能力為依據,以市場占有率、品牌形象和最終利潤為目標,真正按照有效需求來策劃房地產價格。

2.統計方法在市場定價中的應用

篇10

關鍵詞:數據挖掘;統計學;涵義

統計學如何為數據挖掘服務,這是在“數據挖掘”飛速發展的今天,統計工作者必須回答的一個問題,我國廈門大學的朱建平教授提出:“統計學應該隨時關注數據分析,哪里有數據,哪里就應該有統計分析。”統計學是搜集、展示、分析和解釋數據的學科,它擁有非常深厚的理論基礎,并在社會生活的各個領域發揮著巨大的作用。近代統計學方法與信息處理的關系日益密切,作為信息處理的一個基本工具,統計學方法將發揮越來越重要的作用。

數據挖掘是近十幾年里發展起來的一門嶄新的學科,由于它與統計學都關心從數據中發現某種結構,因而從數據挖掘誕生之日起,就與統計學有了千絲萬縷的聯系。

一、統計學與數據挖掘的涵義

統計學是應用數學的一個分支,主要通過利用概率論建立數學模型,收集所觀察的系統數據,進行量化的分析、總結,進行推斷和預測,為相關決策提供依據和參考;它分為描述統計和推斷統計。描述統計包括對客觀現象的度量、調查方案的設計,對所收集的數據資料進行加工整理、綜合概括,通過圖示、列表等方式進行分析和描述。推斷統計是在搜集、整理監測樣本數據的基礎上,對有關總體做出推斷,其特點是根據隨機性的觀測樣本數據以及問題的條件和假定,對未知事務做出以概率形式表述的推斷。

數據挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的數據中,提取隱含在其中的,人們事先不知道的,但又具有潛在價值的信息和知識(模型或規則)的過程。這個定義包括以下含義:數據源必然是真實的、大量的、含噪聲的;發現的知識可接受、可理解、可運用,并不要求發現放之四海皆準的知識,僅支持特定的發現問題。它能高度自動化的分析原有數據,做出目的性推理,從中挖掘出潛在的模式,從而幫助決策者調整策略,做出正確的決策。它融數據庫技術、人工智能技術、數理統計技術和可視化技術為一體,是一個多學科相互交叉又融合所形成的一個新興的具有廣泛應用前景的研究領域。

二、統計學與數據挖掘的聯系

(一)數據挖掘雖不同于統計分析,但許多挖掘技術又來源于統計分析,數據挖掘中有許多工作可以由統計方法來完成。比如預言算法(回歸)、抽樣、基于經驗的設計等。

(二)數據挖掘不是為了替代傳統的統計分析技術,相反,數據挖掘是統計分析方法的擴展和延伸。大多數的統計分析技術都基于完善的數學理論和高超的技巧,其預測的準確程度還是令人滿意的,但對于使用者的知識要求比較高。而隨著計算機能力的不斷發展,數據挖掘可以利用相對簡單和固定程序完成同樣的功能。

(三)數據挖掘技術的出現為統計學提供了一個嶄新的應用領域,也對統計學的理論研究提出了挑戰。數據挖掘技術有相當大的比重是由高等統計學中的多變量分析所支撐。

(四)統計學與數據挖掘的結合日益緊密。數學是傳統意義上統計學方法的首要工具,而計算機和網絡為代表的信息技術,正逐漸成為統計學應用的首要工具。隨著數據源的不斷膨脹和數據結構的日益復雜,單純依靠數據挖掘技術,已漸露力不從心之態,而統計學的同步發展,正不斷充實、完善著數據挖掘技術。因此,隨著信息化水平的提高,統計學與數據挖掘的應用平臺漸趨統一。

三、預測性挖掘中常用的統計學方法

數據挖掘中應用的統計學預測性方法主要有判別分析和回歸分析。其中,判別分析用于對離散型目標變量的預測,而回歸分析則主要用于對連續性目標變量的預測。

(一)判別分析是在已知研究對象分成若干類型(或組別)并已取得各種類型的一批已知樣品的觀測數據,在此基礎上根據某些準則建立判別式,然后對未知類型的樣品進行判別分類。判別分析是統計學的基本分析方法之一。