數據挖掘課程范文
時間:2023-04-11 02:52:19
導語:如何才能寫好一篇數據挖掘課程,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公文云整理的十篇范文,供你借鑒。

篇1
國外很多大學都開設了數據挖掘類課程,波士頓大學的“數據管理與商務智能”課程主要包括基礎、核心技術、應用三部分。授課方式包括理論內容講授、案例教學,以及學生以團隊合作方式完成項目并進行課堂演講。從麻省理工學院開放性課程資料(斯隆管理學院)中可以看出,在每章講解一種算法之后都盡可能地安排了商務實例的分析,并在課程后期安排了客座講座的形式。國內對于數據挖掘的教學類研究成果也很多,主要集中在三類問題的研究上,較為普遍的是根據專業建立大綱的研究,例如針對電子商務專業進行大綱設計;另外也有專注研究某一種或多種適合數據挖掘或商務智能的教學方法,如專題研討法;還有的討論算法理解與程序設計、軟件應用的關系。
2、基于模塊化方法的課程內容分析
模塊化教學模式是按照程序模塊化的構想和原則來設計教學內容的一整套教學體系,它是在既定的培養目標指導下,將全部教學內容按照一定標準或規則進行分解,使其成為多個相對獨立的教學模塊,且各教學模塊之間可以按照一定的規則有選擇性的重新組合。該方法在20世紀70年代,由國際勞工組織引入教學之中,開發出以現場教學為主,以技能培訓為核心的模塊化教學模式,在很多國家得到廣泛應用。由于該教學法具有針對性、靈活性、現實性等特點,越來越受到教育界的關注。模塊化教學本質上是以知識點與實踐的細化為出發點研究,本課程的知識點細化分為兩個層次:一是從宏觀角度,參考ACM的SIGKDD的數據挖掘課程建設建議,設計課程的基礎內容模塊和高級主題模塊;二是從微觀角度,針對較為復雜的算法進行的知識點劃分。課程內容的一至五章屬于基礎內容模塊,介紹本課程的基礎理論和入門的數據挖掘技術;六至第八章介于基礎內容與高級主題之間,介紹數據挖掘的核心算法,可以根據學生情況進行靈活處理,可強調應用,也可深化算法介紹;第九、十章為高級主題模塊,可以作為擴展材料介紹應用,或為感興趣同學提供算法介紹;課程實踐模塊包含數據倉庫建設與數據挖掘算法的應用,難度居中,可以在引導學生思考的前提下給出實驗步驟,并引導學生使用類似的方法處理不同的數據。
3、基于模塊化方法進行重要知識點的模塊化分析
重要知識點內涵較為豐富,一般體現在經典數據挖掘算法上,通常一大類算法下還分有多個算法,不同算法的在難度上有漸進層次,同一種算法也有很大改進研究空間,講授彈性比較大。因此,適合使用模塊化方法進行處理,并且需要在課程設計中明確一定課時量所要達到的內容和難度。基礎部分為必選內容,介紹基本概念和基本原理;決策樹作為數據挖掘分類算法的最基礎算法也是必選內容,決策樹算法有多種分類,需要進行按照難易程度進行選擇;最后要根據難度選擇其他分類算法進行介紹。
4、結論
篇2
近年來,數據挖掘與商務智能技術發展迅速,充分借鑒國外相關研究,尤其是ACMSIGKDD課程委員會對數據挖據課程建設建議,對進行數據挖掘類課程的教學建設研究有重要意義。ACM(美國計算機協會)于1998年成立了SIGKDD(知識發現興趣小組),致力于知識發現與數據挖掘的相關研究,ACMSIGKDD課程委員會連續多年多次更新其主要課程———數據挖據課程的建議,其中委員會將數據挖掘課程分為基礎部分與高級主題,基礎部分覆蓋了數據挖掘的基本方法,高級主題既有數據挖掘基本方法的深入研究,又有更高級算法的介紹。國外很多大學的計算機科學學院、商學院都開設了數據挖掘類課程并同時進行相關研究。波士頓大學開設了“數據管理與商務智能”課程,課程主要包括基礎、核心技術、應用三部分。許多國外著名大學建立了教學管理系統,提供大量的案例、在線討論和在線輔導功能。國內很多學校都開設了數據挖掘的相關課程,我國大多數高校的課程大綱內容與國外大致相同,只是在實踐部分選用了不同的商務案例。數據挖掘的應用領域廣泛,因此可以根據開課學院和專業選擇合適的實例。
二、根據信息管理專業本科生培養要求確定課程目標
數據挖掘課程是一門綜合性很強的前沿學科,對計算機軟硬件、數據庫、人工智能技術、統計學算法、優化算法等基礎知識都有較高的要求。因此該門課程開設在學生大三下學期,既有相關知識的基礎,又為大四做畢業設計提供了一種思路。信息管理專業是計算機與管理相結合的專業,旨在培養具備信息系統開發能力與信息資源分析與處理能力的綜合應用型人才。對信息管理專業的學生而言,本課程主要的目標是數據挖掘算法原理理解、數據挖掘算法在商務管理問題中的應用以及常用數據倉庫與數據挖掘軟件的熟練應用和二次開發。
三、基于模塊化方法的課程內容分析
模塊化教學模式是按照程序模塊化的構想和原則來設計教學內容的一整套教學體系,它是在既定的培養目標指導下,將全部教學內容按照一定標準或規則進行分解,使其成為多個相對獨立的教學模塊,且各教學模塊之間可以按照一定的規則有選擇性的重新組合。學生可以根據個人興趣和職業取向在不同模塊之間進行選擇和搭配,從而實現不同的教學目標和人才培養要求。模塊化教學本質上是以知識點與實踐的細化為出發點研究的。商務智能方法本身非常豐富,實踐應用也是課程的主要特點之一,因此十分適合使用模塊化的知識分解方式。本課程的知識點模塊管理分為兩個層次,一是從宏觀角度設計課程的基礎內容模塊和高級主題模塊;二是從微觀角度針對較為復雜的教學內容進行的知識點劃分。
1.課程主要內容模塊化分析。目前該課程包括十章理論內容,分別為數據倉庫與數據挖掘的基本知識、數據倉庫的OLAP技術、數據預處理、數據挖掘系統的結構、概念描述:特征化與比較、挖掘大型數據庫中的關聯規則、分類與預測、聚類分析、復雜類型數據挖掘和序列模式挖掘。根據模塊化管理的宏觀角度分類,課程內容的第一至五章屬于基礎理論部分和簡單數據挖掘技術的介紹,可以作為基礎內容模塊;第六至八章為數據挖掘的核心算法,其中既有基礎理論與技術方法,又可深入到較難的方法和復雜的應用,因此介于基礎內容與高級主題之間;第九、十章可以算做課程的高級主題模塊;另外,課程的實踐模塊既包含數據倉庫的建設又包含數據挖掘算法的應用,難度也介于基礎內容與高級主題之間。
2.復雜知識點的模塊化管理。從微觀角度對知識點進行設計主要針對的是上述的高級主題、以及難度介于基礎內容與高級主題之間的章節,由于這些章節知識點在難度上有一定層次,講授內容彈性比較大,因此需要在課程設計中明確一定課時量所要達到的難度。以商務智能技術中的分類算法為例:首先一般的入門課程都會介紹分類算法的概念和基本原理;接著開始介紹分類算法的基礎算法———決策樹,而決策樹算法中又包含ID3等多種算法,并且除了決策樹外,還有其他更高級的分類算法;在真正使用分類法進行預測時,還要分析預測準確度;最終要將所學知識加以應用。這樣就形成了一個結構清晰、難度循序漸進的知識點模塊的層次關系。在宏觀角度、微觀角度對教學內容進行分類的前提下進行相應的授課方法與考查方法的研究,才能真正有助于學生的學習。
四、授課與考核方法設計
對不同層次學生要求不同,這種不同既體現在知識點的要求上,又直接體現在任務的難易性程度上,這都需要教師在課程設計時充分考慮不同要求情況下的不同的授課方式,并使學生清楚自己需要掌握的程度。對于高級算法和實現部分,通常可以選擇一到兩章內容采用專題探討式的教學方法。這種方法是指在教師啟發和引導下,以學生為主體,選擇某個基本教學單元為專題,學生自主研究作為知識傳遞的基本形式,將多種靈活的教學方式綜合運用到教學環節的教學方法。根據信管專業培養方案的培養目標、以及對學生調研的情況,實踐環節比較適合選擇成熟的商務智能工具進行數據的整合和多維數據建模,也就是直接使用現成的;或者使用數據挖掘軟件進行數據建模,完善數據挖掘算法。可以針對學生管理基礎課與IT基礎課知識的掌握情況,選擇合適的工具為學生設計綜合性實驗。實驗中給出部分操作步驟,并在實驗后期僅給出數據與工具,讓學生自己設計數據倉庫、進行數據挖掘、并對挖掘結果進行多種形式的展示。
五、結論
篇3
(武漢科技大學城市學院信息工程學部 湖北 武漢 430083)
摘 要:數據倉庫與數據挖掘是大數據時代產生的一門新興交叉的課程。針對該課程的特點,將CDIO工程教學理念融合到教學過程,重新設置了教學目標與大綱、調整了教學內容、改進了教學方法,總結了數據挖掘課程教學實踐的一般流程并給出具體的實驗教學設計方案。
關鍵詞 :教學改革;數據倉庫;數據挖掘;CDIO
中圖分類號:G642 文獻標識碼:A doi:10.3969/j.issn.1665-2272.2015.09.040
收稿日期:2015-03-15
1 CDIO簡介
CDIO工程教育模式是基于項目的學習的一種模式。CDIO中,C(Conceive)構思,根據工程實踐,讓學生掌握專業知識的基本原理,確定未來發展方向;D(Design)設計,以產品設計與規劃為核心,解決具體問題;I(Implement)執行,以制造為核心,組織一體化的課程實踐,其中包括學生必須掌握的理論知識與實踐能力;O(Operate)運作,即產品應用的各個環節。它以產品的研發到運行的生命周期為載體,通過系統的產品設計讓學生以主動的、實踐的、課程有機聯系的方式學習。CDIO代表工程項目生命全周期,是產業轉型升級對創新人才需求的形勢。
CDIO培養大綱將工程畢業生的能力分為技術知識與推理、個人專業能力和素質、團隊合作與溝通能力、在企業和社會環境下CDIO系統四個層面,大綱要求以綜合的培養方式達到這四個層面的預定目標。其精髓在于:以工程項目設計為導向、工程能力培養為目標的工程教育模式。
2 “數據倉庫與數據挖掘”課程概況
當今的大數據時代,人們處理數據的能力大大增強,快速增長的海量數據已經遠遠超出人們的理解能力,因此數據倉庫與數據挖掘技術得到了廣泛關注,有效地挖掘和運用海量數據,獲得有價值的知識和信息,從而幫助人們制定正確的決策。很多高校為工程類專業本科生開設這門專業課,研究如何將信息處理技術運用于企業管理決策的具體實際。
本工程課程涉及到數據倉庫的設計與構建技術、聯機分析處理OLAP技術、分類與預測、聚類、關聯規則算法、數據挖掘應用綜合項目技術等多方面的知識和技能。通過課程的學習,不僅要求學生掌握在數據倉庫與數據挖掘方面的知識,還要求培養學生的工程CDIO能力。
但是目前許多高校在工程教育采用的教學方式存在以下問題:培養目標不清楚,學術化傾向嚴重;人才培養模式單一,缺乏多樣性和適應性;工程性缺失和實踐環節薄弱;課程體系與產業結構調整不適應等。在教學過程中,強調教師的主導作用,卻忽視了學生的主體作用,忽視了學生的工程意識、工程素質和工程實踐能力的培養。這與高校培養創新性應用型人才的目標相悖。因此,改革勢在必行。
3 “數據倉庫與數據挖掘”課程改革實踐
3.1 基于CDIO理念的教學目標與大綱
CDIO教育理念所提倡的工程畢業生的能力分為技術知識與推理、個人專業能力和素質、團隊合作與溝通能力、在企業和社會環境下CDIO系統四個層面,四個層面上進行綜合培養的教學模式。在CDIO能力培養目標方面,課程在四個能力層面上建立培養目標。
針對“數據倉庫與數據挖掘概述”內容,知識點是數據倉庫的含義與特征、數據挖掘的任務、多維數據模型。講授數據倉庫的概念、特點、構成以及數據挖掘和數據處理的基本知識,使學生有一個初步的理解。培養學生技術知識與推理能力。
針對“聯機分析處理OLAP”內容,知識點是數據倉庫的數據組織、數據預處理、數據存儲、基于多維數據模型的數據分析。本階段如果不結合直觀的舉例講解,學生就失去了興趣,因此筆者要布置一些思考題,教會學生自主學習,自己查閱教材、網絡等資源資料,從中提煉出結論。培養個人分析問題、解決問題的能力、所學知識的靈活應用能力;
針對“分類與預測、聚類、關聯規則”內容,知識點是數據采集、關聯規則算法的設計、結果分析。在這個階段經常會是“數據的堆砌”,講了很廣泛的算法知識卻沒有足夠的時間進行深入理解。因此應抓住關鍵的概念、能力,引導學生提出問題,并學會調查研究,為學生提供深層學習的機會,并把在第一層面所學的知識運用到對問題的解決之中去。這樣,學習的焦點就從“覆蓋”的方式過渡到以學生為中心的學習方式。培養數據獲取能力、程序設計能力、問題表達能力;
針對“數據挖掘應用綜合項目”內容,知識點是項目的準備、進度管理、文檔管理和項目設計和實現。實際工作牽涉到企業或者組織的各個部門多類人員,所有團隊成員之間協同、合作,會有分工、溝通、協調,甚至會有妥協,這就要求在運用實例的過程中一定要具有團隊合作精神。培養工程系統能力和人際團隊能力。
3.2 改革教學內容
在教學內容中安排了兩級項目:多種初級項目和一個高級項目。初級項目是將課程內容分成各種項目,數據主要來源于SQL Server 2008的示例數據倉庫Adventure Works DW,以項目實現促進理論學習;高級項目是綜合性項目:“卷煙產品銷售規律挖掘”,利用卷煙產品歷史銷售數據中蘊含的信息,采用數據挖掘技術對各個卷煙品種銷售的關聯關系進行分析并預測,以制定更加合理的卷煙產品營銷策略。具體項目設置如下:
項目一:基于SQL Server 2008的數據倉庫數據庫及多維數據模型設計。步驟如下:分析組織的業務狀況及數據源結構組織需求調研,收集分析需求采用信息包圖法設計數據倉庫的概念模型利用星型圖設計邏輯模型物理模型設計構建多維數據模型。本項目旨在個人能力的培養(分析問題、解決問題的能力、所學知識的靈活運用能力等)。
項目二:關聯規則挖掘。使用商業智能開發工具進行購物籃分析,以達到重新設計網站功能,提高產品的零售量。
項目三:潛在客戶分析即分類及預測。使用商業智能開發工具分析購買自行車的潛在客戶。
項目四:K-Means聚類分析。使用商業智能開發工具分析客戶購買自行車情況分析。
項目五:貝葉斯網絡應用。使用商業智能開發工具解決一個簡單的預測和診斷問題。
項目二至五旨在培養學生個人能力(數據獲取能力、程序設計能力等)和人際團隊能力(問題表達能力、人際交流能力),倡導學生樂于探究、勤于動手。
高級項目:數據挖掘應用綜合項目“卷煙產品銷售規律挖掘”。將一個相對獨立的項目交由學生自己處理,從信息的收集,方案的設計,到項目實施及最終評價,都由學生自己負責,學生通過該項目的進行,了解并把握整個過程及每一個環節中的基本要求。通過綜合項目,學生完成了CDIO的四個階段,提升CDIO所提倡的四大能力,具體體現如表1所示。
3.3 改革教學方法
在課程教學方法是項目教學法為主,任務驅動法和案例教學法為輔的教學模式,起到很好的教學效果。
4 結語
CDIO工程教育模式由麻省理工學院和瑞典皇家工程學院提出,包括構思、設計、實現和運作四個環節,是國際流行的工程人才培養理念,強調對學生創新思維、實踐能力和團隊協作精神的培養。本文體現了CDIO理念的能力培養要求,將數據倉庫設計開發方法和數據挖掘技術融入具有較強工程背景與應用價值的項目設計與開發中,理論與實踐緊密結合,推動課程建設和課程教學改革。
參考文獻
1 顧佩華,沈民奮,陸小華譯.重新認識工程教育—國際CDIO培養模式與方法[M].北京:高等教育出版社,2009
2 郭長虹. 重構CDIO特色的工程圖學課程體系[J].圖文學報,2013(3)
3 王麗麗. CDIO視角下項目驅動法在“數據倉庫與數據挖掘”教學中的應用[J].電子商務,2013(9)
篇4
Data Mining and Analysis for the Personalized Teaching of Multimedia Technology Course
YANG Nan-yue
(Industrial Training Center, Guangdong Polytechnic Normal University, Guangzhou 510665, China)
Abstract: Since personalized teaching has been implemented in multimedia technology teaching in the past five years, a lot of teaching data accumulated from multimedia technology online learning platform. The article introduced data mining and analysis technology to process these data in order to obtain support and decision-making reference for the improvement of the quality of personalized teaching. First, the snowflake model of courses selection for data warehouse was built. Then the Apriori algorithm was used to dig out the inner link between the students’ media technology achievements and the final grade. And then cluster analysis with k-means algorithm on all students’ scores was conducted. Finally, the calculated results were visualized and analyzed. Practice proved that data mining and analysis technology is a useful tool for quantitative analysis in the teaching.
Key words: data mining; snowflake model; association rule; cluster analysis; personalized teaching
我校的多媒體技術公選課面向全校各年級各專業本科生開課,因此選修本課程的學生來源較復雜,其計算機基礎參差不齊。過往統一步調的授課模式滿足不了不同層次學生的需求,所以從2011年開始,本門課程實施教學改革,以多媒體技術在線學習平臺為基礎,結合課堂授課開展個性化教學,把多媒體技術包含的四大媒體技術課程:圖像處理、音頻處理、視頻處理和動畫制作做成講座的形式,每一門課程分別包含兩到三次的講座,學生根據自己的情況選聽選學。每門媒體技術不同難易度的學習資料都放在學習平臺里,學生可以自由選擇學習資源,并通過網絡或課堂與同學和老師進行學習交流。考核方式為每一門課程最后一次講座講完后在學習平臺上進行隨堂考試,要求每位學生至少選考其中三門。本門課程期末考試也在學習平臺上進行,要求全體學生都必須參加。本教改實施五年來,學生反應良好,同時多媒體技術學習平臺網站上存在著大量學生成績和教師教學及管理過程中的相關數據,那么這些數據之間存在著怎樣的聯系,是否蘊藏著教與學之間的知識和規律?由于數據挖掘技術能夠發現隱藏在海量數據中的潛在聯系和規則,從而預測未來的發展趨勢[1],因此我們把該技術引入學習平臺中的信息資源管理系統,把大量積累的教學基礎數據建立數據倉庫[2],在這基礎上運用數據挖掘手段從中快速準確地提取出重要的信息和有價值的知識,找出影響學習成績的因素,為進一步改善個性化教學的教學質量提供數據支持和決策參考。
1 數據倉庫多維數據模型的建立
數據倉庫的邏輯數據模型是多維數據模型。目前使用的多維數據模型主要有星型模型和雪花模型。一個典型的星型模式包括一個大型的事實表和一組邏輯上圍繞這個事實表的維度表[3]。雪花模型是對星型模型的擴展,將星型模型的維度表進一步層次化,原來的各維度表被擴展為小的事實表,形成一些局部的層次區域[3-4]。建立本課程數據倉庫時,為了減少數據冗余,改善查詢性能我們采用雪花模型結構,如圖1所示。建立以學生選課為中心的選課事實表,三個主維度表“學生表”、“成績表”和“時間表”分別通過“學生鍵”、“成績鍵”和“時間鍵”與事實表直接關聯。其中,主維度表中的“學生表”和“成績表”都有各自的二級維度表,與事實表間接關聯[5]。
2 采用Apriori算法的關聯規則挖掘
關聯規則用于揭示數據與數據之間未知的相互依賴關系,即在給定的一個事物數據庫D,在基于支持度-置信度框架中,發現數據與項目之間大量有趣的相關聯系,生成所有的支持度和可信度分別高于用戶給定的最小支持度(min_sup)和最小可信度(min_conf)的關聯規則。關聯規則挖掘算法歸結為下面兩個問題:(1)找到所有支持度大于等于最小支持度(min_sup)的項目集(Item Sets),即頻繁項目集(Frequent Item Sets)。(2)使用步驟(1)找到的頻繁項目集,產生期望的規則。兩步中,第(2)步是在第(1)步的基礎上進行的,工作量非常小,因此挖掘的重點在步驟(1)上,即查找數據庫中的所有頻繁項目集和它的支持度[4]。本課題對多媒體技術課程學習平臺中所有考試成績進行關聯規則挖掘,采用Apriori算法查找頻繁項目集。
Apriori算法通過逐層迭代來找出所有的頻繁項目集L。用戶需要輸入事物數據庫D和最小支持度閥值min_sup。實現過程為:
1)單次掃描數據庫D計算出各個1項集的支持度,得到頻繁1項集構成的集合L1。
2)連接:為了產生頻繁K項集構成的集合,通過連接運算預先生成一個潛在頻繁k項集的集合Ck。
3)剪枝:利用Apriori算法“任何非頻繁的(k-1)項集必定不是頻繁k項集的子集”的性質,從Ck中刪除掉含有非頻繁子集的那些潛在k項集。
4)再次掃描數據庫D,計算Ck中各個項集的支持度。
5)剔除Ck中不滿足最小支持度的項集,得到由頻繁k項集構成的集合Lk。
Apriori算法如下:
[(1)L1=find_frequent_1-itemsets(D)(2)for(k=2;Lk-1≠?;k++) do begin(3)Ck=apriori_gen(Lk-1); //新的潛在頻繁項集(4)for all transactions t∈D do begin(5) Ct=subset(Ck,t);//t中包含的潛在頻繁項集(6)for all candidates c∈Ct do begin(7) c.count++;(8)end;(9)Lk=c∈Ckc.count≥inmsup(10)end;(11)Answer=UkLk;]
求出頻繁項集L后,1)對于L中的每一個頻繁項目集l,產生l的所有非空子集。2)對于l的每一個非空子集s,如果,[sup_count(l)sup_count(s)≥min_conf],則輸出規則:SL-S[4]。
本課題對近五年選修多媒體技術的學生所有成績數據進行清洗,填補空缺值,去噪,類型轉換,集成等處理后放入數據倉庫中,系統采用Apriori算法找出所有的頻繁項集。為了便于進行關聯規則的挖掘,對成績數據進行離散化處理,轉變成標稱型變量[5]。成績score(簡化為“s”)在85-100區間的表示“優秀”,標記為“1”,在70-84區間的表示“中等”,標記為“2”,在60-70區間的表示“合格”,標記為“3”。多媒體技術每門媒體技術課程:圖像處理、音頻處理、視頻處理、動畫制作和最后的期末考試分別用A、B、C、D、E表示。學生的學號用StudentID表示,那么每個學生選修的N門課和最后期末考試的成績可以表示為{StudentID,Asa,Bsb,Csc,Dsd,Ese},其中Sa,Sb,Sc,Sd,Se的取值范圍是{1,2,3}。例如{ 2011204543021,A3,B1,D3,E3}表示學號為2011204543021的學生,選修了圖像處理,音頻處理和動畫制作這三門媒體技術,其中圖像處理成績為合格,音頻處理成績為優秀,動畫制作成績為合格,期末考試成績為合格,該名學生沒有選修視頻處理,故沒有這門科目的成績。
設定最小支持度閥值min_sup為3%,最小置信度閥值min_conf為70%,系統采用Apriori算法進行數據挖掘,得到滿足最小置信度閥值的規則和相應的置信度如表1。
挖掘結果分析:表1的關聯規則體現學生選修的媒體技術課程種類、科目數量與期末考試成績之間的相互關系。可以看到期末考試成績屬于中等(E2)或合格(E3)級別的,學生全選四門媒體技術比只選學三門的置信度高,即選課數量多的較容易及格或獲得中等的期末成績。另外,在選課種類方面,選B這門課,即選音頻處理的學生比較多,是一個概率比較高的事件,可能這門課內容比較少和易掌握,因此選學選考的學生就多。但這門課的成績對期末考試成績影響不明顯,說明教師這門課出的考題區分度低,沒能反映出學生的水平層次。在最小支持度閥值min_sup為3%的情況下,選A(圖像處理),C(視頻處理)和D(動畫制作)這幾門課并獲得優秀成績(A1,C1,D1)的很少,即小概率事件被過濾掉了,沒能挖掘出它們與期末成績之間的關聯性。但這幾門課程成績中等或合格與期末成績存在內在關系,也就是說如果這幾門課成績都是中等的,期末考試成績大部分都為中等,一小部分可以達到優秀。如果這幾門課成績都是合格,期末考試成績就是合格。說明這幾門課程的考題比較真實反映出學生掌握技能的實際水平,致使期末綜合性的考試成績與學生平時掌握程度相符合。這也意味著個性化教學具有一定的成效。
本課題對近五年的學生多媒體技術每科成績與期末成績進行聚類分析,把學生劃分到若干不同的類中,分析各個類的特征,從而考察實施個性化教學后的效果。設定85分,75分和65分為三個初始的聚類中心,對學生的所有成績進行聚類分析,找出同一類別學生的學號,以此為索引,查找到該類中各個學生的專業與年級,繪制出餅狀圖,再繪制出該類學生所選各門媒體技術的平均分柱狀圖,通過這幾個圖表考察不同專業不同年級學生在本門課程優秀中等合格若干成績區間的分布情況,從而檢查實施個性化教學的效果,為今后的改進方案提供參考。例如調整后得到的最終聚類中心為82分的學生,各門媒體技術的平均分和專業、年級分布如圖3~圖5所示。
從上面幾個圖可以看出,成績為優秀的學生主要來自美術、計算機和電信這幾個專業,大三、大四的學生比較多。分析其中的原因,主要是美術學院很多專業課需要用二維、三維圖像軟件或視頻軟件進行制作和處理,他們對這門課程已經有一定的基礎,所以學起來比較輕松,也容易取得高分。而計算機和電信專業中高年級的學生學習和使用軟件的能力比較強,因此掌握多媒體技術各個媒體軟件較其他專業學生快,并且能夠靈活運用,因而較易取得比較優異的成績。
最終聚類中心為64分的學生,各門媒體技術的平均分和專業、年級分布如圖6~圖8所示。
從圖中可以看出,這個類別的學生主要來自文科方向的專業,年級分布差異不大,大四所占百分比稍微比其他三個年級略高,有可能是學生們最后一年為了修滿選修課學分而選了這門課,目的是混個及格拿到學分,因此學習積極性和學習態度不佳,導致大部分成績徘徊在60來分。還有一種可能性是大四學生畢業在即,需要寫簡歷找工作,做自我介紹作品等,覺得掌握一些多媒體技術可以作為輔助工具因此選了本門課程。可惜有效學習時間明顯不如前三年充足,加上文科方向的同學計算機基礎和軟件學習能力較理工類學生薄弱,因此成績不太理想。
篇5
【關鍵詞】 工程項目; 成本核算; 會計科目; 數據挖掘
工程項目成本核算是成本管理的一項重要內容,而成本核算的科目體系又是成本核算的一個基礎且重要的組成部分。科目體系的好壞將直接關系到成本分析與控制工作的開展,進而影響到成本管理水平的高低。因此,科學、合理地設計科目體系顯得尤為重要。
一、當前的工程項目成本核算科目體系存在嚴重不足
(一)科目設置過于粗糙,不利于查閱明細
以“工程施工”科目為例,當前絕大多數施工企業的成本核算科目體系如表1所示,其科目設置非常簡單,最多只到三級科目,尚有很多綜合科目未設明細。以“其他直接費”科目為例,如果需要了解其中安全措施費的發生情況,將很難直接從其科目余額表和明細賬上查詢到理想的答案;只有逐一翻閱其明細賬上每筆記錄的憑證,將其中屬于安全措施費的所有金額匯總,才能計算出安全措施費的發生額。顯然,這給成本分析與控制造成了很大不便。
(二)科目按經濟內容分類設置,無法洞悉成本動因
可以看出,當前的科目體系仍然沿襲傳統按經濟內容分類設置的模式,分工、料、機、其他等方面設明細,整個科目體系沒有一處的金額體現了成本動因。這樣,如果需要對成本發生的原因進行分析并實施控制,必須對成本核算數據重新分類匯總,進行額外的專項分析才能達到目的,勢必影響成本分析與控制工作的效率,而且數據處理和分析的周期較長,無法及時獲得有用信息,工作效果也不理想。按經濟內容分類設置科目,一旦明細科目設置過多,會成倍增加成本分析與控制的難度,因為沒有將各項成本費用按其內在成因歸類,而是按其表象全部羅列出來,只會顯得繁雜,也難以窮盡,增加了成本分析的內容,同時也增加了成本控制的事項;明細科目設置過少,又過于粗糙、過于籠統,同樣不利于成本分析與控制。
(三)科目體系不夠科學,忽略了成本發生的內在規律性
當前的科目體系不僅過于粗糙而且也無法洞悉成本動因,再者就是忽略了成本發生的內在規律性。長期的施工生產實踐表明,工程項目的某些成本與另外一些成本之間存在著正比例關系、反比例或者某種相關關系,但是顯然無法從當前的科目體系中發現和看到這些規律。
二、工程項目成本核算數據利用不充分和數據挖掘的意義
工程項目及其施工生產具有唯一性特征和一次性特征。所謂唯一性特征,是指任何一個工程項目都是唯一的、不可復制的。工程項目設計包括科學規劃工程項目的規模、性能等,工程項目施工包括合理安排施工組織、施工環境(地理位置、氣候等)、施工方案、施工工藝等;由于工程項目的用途和性狀各不相同,設計和施工過程中的不可控因素和人為因素太多,可以說沒有任何兩個工程項目是完全一樣的。所謂一次性特征,則是指工程項目施工不像制造企業生產新產品,新產品生產出來,如果檢驗不合格可以再試驗,試驗后再生產,不合格再試驗,直到合格為止,而工程項目只能一次性建設完工并驗收合格,否則將對施工企業造成非常嚴重的損失甚至破產。
恰恰是由于工程項目及其施工生產的這兩個特征,導致許多工程項目的管理者想當然地認為已完工項目的成本核算數據對正在施工的和將要施工的項目并沒有借鑒意義。其結果就是大量工程項目核算數據沒有得到分析、挖掘等形式的充分利用,大部分施工企業只將其作為計算工程項目成本、利潤并結算的依據,過后就封存保管,出現了工程項目成本核算數據使用的一次性的狀況。這也間接導致了一些施工企業工程項目成本核算的隨意性、不準確的問題。
事實上,事物的偶然性中總是蘊含著必然性,成千上萬的已完工項目的成本核算數據中可能隱藏著某些規律性,亟待深入挖掘。數據挖掘正是一種從大量的數據中挖掘那些令人感興趣的、有用的、隱含的、先前未知的和可能有用的模式或知識的技術及工具。數據挖掘出現于20世紀80年代后期,在20世紀90年代有了突飛猛進的發展,當前已被廣泛應用于企業的客戶關系管理、內部控制和績效評價等領域,相信按照數據挖掘的思路并利用其技術,對工程項目成本核算科目體系予以改進,也將對工程項目成本管理有所裨益。
三、應用數據挖掘改進工程項目成本核算科目體系
如前所述,數據挖掘就是從大量的數據中挖掘那些令人感興趣的、有用的、隱含的、先前未知的和可能有用的模式或知識。數據挖掘任務一般可以分為兩類:描述和預測。描述性任務刻畫數據庫中數據的一般特性;而預測性任務則要在當前數據基礎上進行推斷,作出預測。這樣,數據挖掘通過預測未來趨勢及行為,幫助管理者作出前攝的、基于知識的決策。本文將基于以下四類數據挖掘功能,具體討論工程項目成本核算科目體系的改進方向及形式。
(一)自動預測趨勢
數據挖掘的自動預測趨勢功能是在數據庫中找尋具有預測作用的信息,一個典型的例子就是發現、證實并預測工程項目成本構成比重的變化趨勢。隨著科學技術的發展和管理水平的提高,工程項目成本中的間接費用比重會呈下降趨勢,由此可以推斷構成工程主體的材料費用占工程項目總成本的比重將呈上升趨勢,這就是工程項目成本構成比重的變化趨勢。但這只是人們的主觀感受和判斷而已,如果需要準確地得出以上結論,就可以對已完工項目的成本數據采用科學、恰當的方法進行數據挖掘,客觀地獲知工程項目成本構成比重的變化趨勢,進而為各成本費用項目控制標準的制定提供依據。
當前的“工程施工”一級科目按經濟內容分類設置了“人工費”、“材料費”、“機械費”、“其他直接費”和“間接費用”等明細科目,可以說基本滿足數據挖掘自動預測趨勢功能的要求,但還不夠詳盡。因此,科目級次可以從當前的三級適當地增加到五級甚至六級,對各明細科目進一步細分。如在表2中,對“機械費”科目進一步細分成“自有設備”和“租賃設備”兩個科目單獨核算,預期可以更充分地反映出市場細分、租賃行業發展和施工企業大量租賃通用設備的發展態勢。
(二)關聯分析
關聯是數據庫中存在的一類重要的、可被發現的知識,如成本構成中某些具體成本項目之間存在的某種規律性(一項成本的發生是由另一項成本的發生所引起的,或者一項成本的增加會導致另一項成本的減少等等)。關聯分析的目的就是要找出數據庫中隱藏的關聯網。工程項目成本中也存在著一些明顯但卻未被證實的關聯關系。
工程項目質量成本主要由兩個方面組成:一是為了保證工程質量而發生的各種質量預防成本和鑒定成本;二是因工程質量未達到標準需維修及返工而造成的故障成本。預防成本主要包括為了保證工程質量而支出的研究、規劃、改進工序和規范操作的費用及各種涉及工程質量的培訓費用;鑒定成本主要包括檢查、評定工程質量、工序質量是否滿足規定要求和標準所需的費用及相關人員的工資;故障成本主要包括施工生產過程中處理工程質量缺陷而產生的返工費用、材料損失、停工費用及需要施工單位負責的保修費、賠償費等。一般來說,工程質量預防成本、鑒定成本和故障成本之間存在著密切關系:預防成本、鑒定成本屬于保證工程質量的費用,和質量水平成正比,即質量水平越高,成本投入越大;而故障成本屬于損失性費用,和質量水平成反比,即質量水平越高,故障成本越低。也就是說,預防成本、鑒定成本越高,故障成本越低,兩者之間是反比關系,這就是質量成本內部的關聯關系。
同樣,安全成本中也有預防成本和損失成本之分:預防成本是施工過程中為了防止各種安全事故發生而支出的安全措施費;損失成本則是工程發生安全事故所造成的各種材料損失、賠償損失和停工損失。一般預防成本越高,損失成本越低;預防成本越低,損失成本越高,兩者之間也存在著一種反比關系。
工程項目成本中也許存在著諸多這種關聯關系,如表2所示,對某些成本費用項目根據其內部關聯關系分類設置明細科目,勢必可以更充分且便利地反映工程項目成本發生的內在規律性,有利于工程項目成本分析與控制。
(三)聚類分析
聚類分析的功能在于建立一種歸類方法,如將若干工程項目成本按照性質上的親疏程度進行歸類。
工程項目間接費用主要包括項目管理人員工資及福利費、通訊費、差旅交通費、業務招待費、辦公用品折舊攤銷費、車輛使用費、意外保險費、房屋租賃費,等等。從用途來看,種類繁多,但這些費用的發生可以歸于幾大成本動因,如工程項目組織規模(人數)決定著項目管理人員的工資及福利費;工程項目離公司總部的距離遠近決定著差旅交通費;工程項目覆蓋范圍的大小決定著車輛使用費;施工環境(危險程度)決定著項目應為項目管理人員購買意外保險費的金額。通過聚類分析,可以將工程項目間接費用歸為幾類,找出每一類共同的成本動因和特點,有利于分析每一類成本的發生、超支和節約狀態,進而更好地研究、制定控制成本的對策。
如表2所示,“間接費用”科目根據成本動因分成“組織規模動因”、“施工范圍動因”等科目單獨核算,并進一步細分,就可以嚴密監視每一類成本的發生是否符合其成本動因規律,而且能夠更有針對性地對工程項目間接費用實施控制。
(四)偏差檢測
數據庫中的數據常有一些異常記錄,從數據庫中檢測出這些偏差很有意義。工程項目成本中也會存在一些異常成本,如發生嚴重的安全事故、異常的雷雨天氣導致工期拖延、當地居民的干擾等都會導致異常成本發生。如果把這些異常成本混作正常成本一起核算,將不利于工程項目成本分析與控制以及考核。因此,單獨設置了“異常成本”科目,同時通過數據挖掘的偏差檢測技術,專門、單獨核算這些成本。
綜上所述,改進后的科目體系如表2所示。
四、改進后工程項目成本核算科目體系優點分析
改進后的科目體系不但能夠彌補當前科目體系的諸多缺點,而且還能強化工程項目成本分析與控制,產生意想不到的效果。
(一)并不增加成本核算難度
表2的科目設置看似復雜,其實不然。隨著會計電算化的普及,手工賬已逐漸退出歷史的舞臺,在財務軟件上設置會計科目以及進行賬務處理都是一件非常容易的事情,而且在同一套財務軟件系統中,一個工程項目設置好的科目體系還可以非常便捷地復制到任何其他工程項目。因此,改進后的科目體系并不增加成本核算難度。
(二)無需額外的專項分析即可獲得有價值的信息
由于科目設置的細化、科目級次的增加,根據改進后的科目體系生成的科目余額表或明細賬將具有更豐富的信息含量,而且一目了然。如異常成本、間接費用等的金額是多少、是由什么原因引起的都可以從科目余額表或明細賬中直接查詢到,不再需要對成本核算數據重新分類匯總,進行額外的專項分析,從而縮短了成本分析所需的數據處理實踐,節約了資源,提高了效率,增強了效果,也使得非財務出身的企業領導能夠比較容易地看懂成本構成,以及成本發生是否合理。
(三)有利于成本分析與控制及相關決策
更豐富的信息含量,必然有利于更具體而微的管理。如“機械費”分成“自有設備”和“租賃設備”,就能將兩種費用進行對比分析,從而發現哪類設備更能為工程項目節約成本,作出相關生產決策。“其他直接費”下設有“安全成本”等三級科目,通過關聯分析,又可以發現其中“預防成本”與“損失成本”之間的關聯關系,從而找到安全成本的一個合理控制標準,即預防成本與損失成本之和的最小值。同樣,“間接費用”按成本動因分類核算,就可以一目了然地找到成本發生的原因,如果某種動因導致的成本出現異常,就可以有的放矢地應對。
【主要參考文獻】
[1] 彭英.數據挖掘綜述[J].德宏師范高等專科學校學報,2009(1).
篇6
關鍵詞:數據挖掘;院校教育;教學管理
中圖分類號:G424文獻標識碼:A文章編號:1009-3044(2009)27-7591-02
Discusses the Application of Data mining Technology in the Colleges and Universities Education Informationization Shallowly
LI Yong
(The Computer Room of Bengbu College of Automobile Management, Bengbu 233011, China)
Abstract: As one kind of emerging data technology,the data mining obtains the widespread application in many domains.The article embarked from data mining's concept,has outlined the major function and the process of data mining,and expounded the application of data mining in the colleges and universities education informationization from the teaching management,the teaching appraisal,the curriculum,the teaching method choice and so on.
Key words: data mining; colleges and universities education; teaching management
現代計算機技術、信息通訊技術和網絡技術在院校教育系統的整合應用,在一定程度上實現了教育教學、組織管理、校園生活服務等活動的數字化、網絡化、自動化,提高了教育質量和效率,形成了適應信息社會要求的全新的教育和管理模式,即教育信息化。院校教育信息化帶來的是信息量的急劇增長和對信息提取的更高要求,現在再依照傳統方法在海量數據中尋找決策的依據是很困難的事情。數據挖掘是一個新興的多學科交叉領域,利用數據挖掘技術可以幫助人們分析、理解存儲在計算機系統中的海量數據,為決策提供支持,因此,可以借助數據挖掘工具去發掘院校教育數據中隱藏的規律或模式,為教育教學決策提供科學依據和更有效的支持。
1 數據挖掘
1.1 數據挖掘的定義
數據挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、有用的信息和知識的過程。數據挖掘是對數據內在和本質的高度抽象與概括,是對數據從感性認識到理性認識的升華。它涉及對數據庫中的大量數據進行抽取、轉換、分析以及模型化處理從中提取輔助決策的關鍵性數據,因此數據挖掘就是深層次的數據信息分析方法。
1.2 數據挖掘的主要功能
具體來說,數據挖掘具有預測趨勢和行為、關聯分析、聚類、概念描述以及偏差檢測等主要功能。
預測趨勢和行為:數據挖掘可以自動在大型數據庫中尋找預測性信息,以往需要由手工分析大量數據完成的問題如今可以通過數據挖掘迅速直接地得出結論。
關聯分析:數據關聯是數據庫中存在的一類重要的可被發現的知識。若兩個或多個變量的取值之間存在某種規律性,就稱為關聯。
聚類:數據庫中的記錄可被劃分為一系列有意義的子集,即聚類。聚類增強了人們對客觀現實的認識,是概念描述和偏差分析的先決條件。
概念描述:概念描述就是對某類對象的內涵進行描述,并對其特征進行概括。
偏差檢測:數據庫中的數據常有一些異常記錄,從數據庫中檢測這些偏差很有意義。偏差包括很多潛在的知識,如分類中的反常實例、不滿足規則的特例等。
總之,數據挖掘所要處理的問題,就是在龐大的數據庫中找出有價值的隱藏事件,并且加以分析,獲取有意義的信息,歸納出有用的結構,作為決策者進行決策的依據。
1.3 數據挖掘的過程
數據挖掘一般包括以下幾個基本過程:
1) 確定和逐步理解應用領域。清晰地定義出業務問題,這是數據挖掘的重要一步。
2) 數據選擇。搜索所有與業務對象有關的內部和外部數據信息,并從中選擇出適用于數據挖掘應用的數據。
3) 數據預處理。研究數據質量,確定將要進行的挖掘操作的類型。
4) 數據編碼、數據轉換。將經過預處理的數據進行一定的格式轉換,使其適應數據挖掘系統或挖掘軟件的處理要求,形成一個分析模型。
5) 數據挖掘。利用各種數據挖掘方法對數據進行分析,挖掘用戶需要的各種規則、趨勢、類別、模型等。
6) 解釋結果。將挖掘結果以可視化的形式展現在用戶面前。
7) 管理發現的知識。
2 數據挖掘在院校教育信息化中的應用
院校教育信息化所產生和積累的數據,為我們進行數據挖掘提供了有效的數據。數據挖掘技術可以應用于院校教育信息化的多個方面,如教學管理,教學評價,課程設置,教學方法選擇等等。
2.1 輔助教學管理
隨著計算機在教學管理方面的廣泛應用,學生和教師的學習、工作、獎勵、處罰等。
信息被存儲在教學管理數據庫中,通過分別對師生數據庫進行挖掘,利用得到的有價值的數據來制定正確決策。
2.1.1 合理制定教師培訓、招聘計劃
在院校教師管理中,傳統方法是運用日常管理中積累表層信息實施決策,這樣只能獲得數據的表層信息,并不能獲得內在屬性和隱含的信息。如果轉變理念,運用數據挖掘理論,采用新技術分析這些數據,就會使大量的數據信息得以有效利用。
利用分類算法對不同年齡、學歷、職稱級別的教師教學數據進行分析,確定哪些專業的人才可以通過內部培訓產生,哪些專業人才短缺而且急需,需要通過引進解決,從而達到平衡內部人才和外部招聘人才的關系,進而制定教師進修、培訓、招聘計劃,以調整師資隊結構,使專業教師分布均衡。
2.1.2 分析學生特征
學生入學后,在校學生管理數據庫中存放有大量的學生檔案,包括的內容有家庭情況、身體狀況、入校前后的學習成績、特長愛好、獎懲等信息。利用數據挖掘的關聯分析和演變分析等功能,在學生管理數據庫中挖掘有價值的數據,分析學生特征,掌握學生的狀態,幫助學生修正自己的學習行為。通過對學生特征分析結果和事先制訂的行為目標標準進行比較,使學生提高學習能力、完善人格,促進其綜合素質的發展。
2.2 輔助教學評價
教學評價就是根據教學目標和教學原則的要求,系統地收集信息,對教學過程中的教學活動以及教學成果給予價值判斷的過程。其內容主要包括對學生“學”的評價和對教師“教”的評價。目前,院校教育評價指標主要包括學生綜合測評指標和課堂教學評價指標,這些評價指標多數是參考國內外相關評價指標體系并結合實際操作中的經驗和調查問卷等制定的,對于各項指標之間的關系、重要程度以及指標存在的合理性等方面很難作出判斷,將關聯規則和粗糙集理論應用于各評價系統,可以對指標進行排序、約簡等,在一定程度上對評價指標進行優化,可以找到比較合理且簡單易行的評價指標體系。
首先,院校教育信息化產生了大量數據,如學生的學習成績數據庫、行為紀律數據庫、獎勵處罰數據庫等。利用數據挖掘工具對這些數據庫進行分析處理,可以及時得到學生的評價結果,對學生出現的不良學習行為進行及時指正。同時,還能夠克服教師主觀評價的不公正、不客觀的弱點,減輕教師的工作量。
其次,將關聯規則運用于教學評價數據中,探討教學效果的好壞與教師年齡、職稱之間的關系、學生各項素質指標之間的關系等,能夠及時地對教師的教學和專業發展以及學生的學習和個性發展提供指導。
最后,將數據挖掘中的關聯規則應用于分析試卷數據庫,根據學生得分情況可以分析出每道題的難易度、區分度、相關度等指標,教師也可以據此對試題的質量作出比較準確的評價,進而可以用來檢查自己的教學情況及學生的掌握情況并為今后的教學提供指導。
2.3 合理指導課程設置
院校的課程設置有其一定的規律性,先基礎,后專業,學習是循序漸進的。如計算機專業的學生在學習數據結構這門課程之前,會先學習語言程序設計和離散數學等課程。如果先行課程沒有學好,勢必會影響后續課程的學習。此外,同一年級學習同一課程的不同班級,由于授課教師、班級文化的不同,班內學生的總體成績也會有所差異。每學期安排課程的多少,也會影響學生的學習效果。我們可以利用學生的學習成績數據庫中存放的歷屆學生各門學科的考試成績,結合數據挖掘的關聯分析與時間序列分析等相關功能,從這些數據中挖掘出有用的信息,幫助分析這些數據之間的相關性、回歸性等性質,得出一些具有價值的規則和信息,最終找到影響學生成績的原因,并在此基礎上對課程設置做出合理安排。
2.4 輔助選擇適當教學方法
在教學過程中,教師通常采用多種教學方法完成對本門課程的教學任務,如講授法、討論法、案例法、演示法、實驗對比法、參觀學習法等等。這些大量的教學班次實踐過的經驗數據存放于教學數據庫中,可以用數據挖掘的方法來挖掘數據庫中的數據,判定當前的教學班應該采取什么教學方法才能滿足教學需要,更有利于學生對知識的理解和吸收。課程結束后將每個學生的成績和對教學方法的評價進行綜合,運用回歸線性分析、關聯規則的方法來判斷本次教學方法適合哪一類學生,對于分類、分層次教學具有推廣和指導意義。
3 結束語
數據挖掘作為一種新興的數據處理技術,在數據的利用和提取方面發揮著日益重要的作用。在教育領域的應用,為教學工作的決策、設計、實施以及評價等各項內容提供了新的途徑和方法,隨著數據挖掘技術在教育領域中應用功能及技術的不斷發展和完善,必將發揮越來越大的作用。
參考文獻:
[1] Insight into Data Mining Theory and Practice.范明,牛常勇,譯.數據挖掘基礎教程[M].北京:機械工業出版社,2009.
[2] 段向紅,張飛舟.數據挖掘技術及其在職業教育中的應用探討[J].職業教育研究,2007(7).
篇7
關鍵詞:數據挖掘; 關聯規則; 學生成績; Apriori算法
中圖分類號:TP392文獻標識碼:A文章編號文章編號:1672-7800(2013)012-0133-03
作者簡介:岳超(1986-),男,西南科技大學計算機科學與技術學院碩士研究生,研究方向為教育技術與知識工程;范太華(1962-),男,西南科技大學計算機科學與技術學院副教授、碩士生導師,研究方向為數據挖掘和系統結構;姬亞利(1988-),女,西南科技大學計算機科學與技術學院碩士研究生,研究方向為網絡教育教學設計;衣峰(1987-),男,西南科技大學計算機科學與技術學院碩士研究生,研究方向為網絡教育與移動學習。
0引言
隨著招生規模的不斷擴大,教務管理系統中的數據急劇增加,普遍存在的問題是學生成績數據量過于龐大,但目前對這些數據的處理還停留在初級的數據備份、查詢及簡單統計階段,如何利用這些數據理性地分析教學中的成效得失以及找到有關影響學生學習成績的因素是廣大教師共同關心的問題[1]。 本文著重討論了數據挖掘技術在學生成績這一海量數據中的應用,發現成績數據中隱藏的課程相關規則或模式,力圖通過關聯與分類,得出一些有用的知識,對教學質量的提高起到積極的促進作用。
1數據挖掘及關聯規則
數據挖掘 (Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的但又是潛在有用的信息和知識的過程。數據挖掘是一個循環往復的知識發現過程,通過對挖掘結果的描述、分析與評價,不斷優化數據挖掘模型和挖掘算法,最終獲得最優化數據挖掘解決方案[2]。
1.1數據挖掘流程
(1)確定業務對象。清晰地定義出業務問題,認清數據挖掘的目的是數據挖掘的重要一步。挖掘的最后結構是不可預測的,但要探索的問題應是有預見的,為了數據挖掘而數據挖掘則帶有盲目性,是不會成功的。
(2)數據準備。①數據的選擇:搜索所有與業務對象有關的內部和外部數據信息,并從中選擇出適用于數據挖掘應用的數據;②數據的預處理:研究數據的質量,為進一步的分析作準備,并確定將要進行挖掘操作的類型;③數據轉換:將數據轉換成一個分析模型,這個分析模型是針對挖掘算法建立的。建立一個真正適合挖掘算法的分析模型是數據挖掘成功的關鍵。
(3)數據挖掘。對所得到的經過轉換的數據進行挖掘。除了完善和選擇合適的挖掘算法外,其余一切工作都能自動地完成。
(4)分析和同化。①結果分析:解釋并評估結果,其使用的分析方法一般應視數據挖掘操作而定,通常會用到可視化技術;②知識的同化:將分析所得到的知識集成到業務信息系統的組織結構中去。數據挖掘的過程如圖 1 所示。
1.2關聯規則簡述
關聯規則挖掘就是在海量的數據中發現數據項之間的關系,關聯規則的支持度(support)和置信度(confidence)是規則興趣度的兩種度量。他們分別反映了所發現規則的有用性和確定性。 一般地,用戶可以定義兩個閾值,分別為最小支持度閾值(minsup)和最小置信度閾值(minconf)。 當挖掘出的關聯規則支持度和置信度都滿足這兩個閾值時,就認為這個規則是有效的,否則,就是無效的。 這些閾值一般可由領域專家設定,也可以進行其它分析,揭示關聯項之間的聯系。
2基于數據挖掘的高校學生成績分析
對學生成績的正確分析,是保證教學工作順利進行的關鍵,揭示一些“教”與“學”的現象和規則,能更好地指導教師的“教”與學生的“學”,為教育教學的計劃和決策提供依據, 提高教學的效果和成果。
2.1數據采集
高質量的數據,是保證數據挖掘成功的前提保證。本研究所需數據取自計算機專業學生的期末考試成績數據庫文件,確定某門課程和其它課程之間的關聯性。為減少不必要的影響因素,影響關聯規則的產生,刪除了英語類、思政類、體育類的課程,將數學類和計算機課程進行分析,最終隨機抽取 385 名學生的《C&C++ 語言程序設計》、《線性代數》、《離散數學》、《計算機系統原理》、《計算機網絡》、《計算機組成原理》、《軟件工程》、《數據庫原理》、《數據結構》等課程的期末考試成績。
2.2數據預處理
數據預處理是數據挖掘的關鍵階段,原始數據往往存在不完整的、含噪聲的和不一致的數據,不能直接運用于數據的挖掘,需要對其進行數據預處理,包括數據清理、數據集成、數據變換等內容。
(1)數據清理。通過填充缺失值,光滑噪聲并識別離群點,糾正數據中的不一致。從數據庫中導出字段包括學號、課程名、成績、備注等信息。對備注中顯示補考、重修的成績填充為50分。對缺失值的填充,我們運用了決策樹歸納的方法,填寫最可能的值進行填寫,以便數據挖掘結果更準確。經數據清理的數據如表1所示。
(2)數據集成。將多個數據源合并到一致的數據存儲,依據以往經驗思政類和體育類課程對本研究的結果影響不大,予以刪除。根據此類思想整理數據,并將所有數據集成到一個Excel中,最終數據包含4 065條271名學生的15門數據。
(3)數據變換。將數據轉化成適合于挖掘的形式,如將屬性數據按比例縮放,使之落入一個比較小的區間內。由于成績是按照數值形式存儲的,不利于數據的挖掘,需要對各科成績進行離散化處理,將成績分為優秀、良、一般、差4個等級,分別用A、B、C、D進行標識,規定85~100為A,75~85為B,60~75為C,60分以下為D。筆者運用Apriori算法對表1數據進行關聯規則的挖掘,進行數據轉化后如表2所示。
2.3Apriori算法的運用
采用SPSS Clementine工具進行數據挖掘,預處理的數據已滿足Apriori算法對數據的要求,導入數據可直接使用Apriori模型進行分析。為了得到更有效的數據,筆者進行了反復的驗證。設置條件支持度為0.15,最小規則置信度為0.75,挖掘結果如圖2所示。
2.4結果分析
上面挖掘的關聯規則并非每條都有現實意義,我們進一步進行處理,將關聯規則模型導出,分析這些關聯規則,得到主要知識如下:
(1) 學好計算機應用基礎、C&C++程序設計、數據結構是學好數據庫的基礎,數據結構又是學好軟件工程的基礎。
知識發現過程如下:計算機應用基礎=A =>數據庫=A,支持度為32.32%,置信度為85.3%。計算機應用基礎和數據庫同時是A的人數占總人數的32.32%,計算機應用基礎為A中85.3%的人數據庫原理也為A,所以說要學好數據庫原理先要學好計算機應用基礎,C&C++程序設計=A =>數據庫原理=A,支持度為42.35%,置信度為86.56%,同上解釋,C&C++程序設計也是數據庫原理的基礎。數據庫原理=A =>軟件工程=A,支持度45.36%,置信度為81.02%,數據庫原理也是軟件工程的基礎。
(2) 學好離散數學是學好數據結構的基礎。
(3) 要把計算機操作系統學好,計算機組成原理、C&C++程序設計、數據結構、離散數學是基礎。
(4) 計算機操作系統取得好成績的人數中76%的人計算機網絡也學的好。
(5)C&C++程序設計、數據結構和數據庫原理又是學好軟件工程的基礎。
此處只列出了部分知識發現,管理者可以以此為參考,結合實際情況對所學的課程進行調整,并通過預警對學生的學習進行提醒和幫扶。學生可以結合自己的成績及時預測某門課程的成績,及時補救,加大課程的學習力度。
3結語
利用關聯規則中的Apriori算法對計算機科學與技術專業的課程進行了挖掘,找出了隱藏在課程背后有趣的規律,發現偏離正常學習軌道的學生,及時進行預警和干預,幫助學生順利完成學業,對學生課程的學習和管理者的決策提供參考,也為關聯規則在其它學科的應用提供了思路。
參考文獻參考文獻:
[1]朱艷麗,高國.Apriori算法研究及其在學生成績分析的應用[J].福建電腦,2010(1):47.
[2]韓家煒.數據挖掘概念與技術[M].北京:機械工業出版社,2010:41-43.
[3]王海容.數據挖掘在學生成績分析的應用[J].電子設計工程,2013,21(4):54-56.
篇8
關鍵詞:關聯規則 數據挖掘 學生成績 預警系統
中圖分類號:G64 文獻標識碼:A 文章編號:1672-3791(2013)02(c)-0023-01
高校教學管理的重心在于不斷提高高校教學水平,關鍵在于加強學生成績的管理。目前,通過數據挖掘技術對教學數據庫的不斷分析研究,其在教育方面的研究成果越來越突出。如果設計一套高校學生成績預警系統,參考高校教務信息系統數據庫,并使用數據挖掘技術對高校學生成績數據庫進行分析,系統通過挖掘各學生每一課程的成績數據,計算出不同成績水平的產生概率,通過原有的成績數據推測今后的成績趨勢,進而找到與本課程相對應的關聯規則作為預警因素,建立起預警系統,這樣就能夠及時評估學生的學習成績,督促學生改進學習方法,以提高其成績水平。
1 數據挖掘含義及基本原理
數據挖掘(Data Mining,DM)通俗地說就是從數據中挖掘信息。由于人類的認識水平有限,很多模糊的、隨機的、不完全的、有噪聲的數據中隱藏的信息就不容易被發現,但是通過對一系列有關數據的分析和挖掘,就會使大量重要的潛在知識浮現出來。數據挖掘將數據庫、數據網絡、統計數學等技術結合起來,從而進行預測、分類、估計、復雜數據類型挖掘、相關性分組或關聯規則等處理。在高校教務管理工作中,高校學生成績與成績的各影響因素之間潛藏著很大的聯系,而數據挖掘技術可以對此進行全面地分析。所以,各個從事此項研究的人員開始設計并逐漸將數據挖掘技術與高校教學管理系統結合起來,擴展數據挖掘技術應用的新領域,并多方面、多角度的定性分析學生成績情況。
數據挖掘主要是通過關聯規則數據挖掘算法進行:根據所需挖掘出的相符合關聯規則,設定最低可靠度和最小支持度兩個閾值,即用來表示所需的關聯規則一定要符合的最小可信任程度和所需的關聯規則一定要符合一組數據量在統計意義上能達到最低要求。
2 現在狀況下對學生成績的管理
一般情況下,教務系統的管理人員雖然能夠在數量較大的數據庫中作普通的查詢,或對一定數量學生的成績進行簡單統計處理或數學排序,但是如果想進行進一步的研究,那么這種傳統下管理數據庫的方法就只能望而卻步了。另外,在高校逐漸擴大招生人數的情況下,成績管理系統也需要處理越來越多的數據,解決更加繁瑣的問題。因而,在這種數據處理壓力較大狀況下,就要求更加強大的數據處理系統來進行工作。如果僅僅將計算機作為存儲工具而存放大數量形式不一的數據,而不去挖掘在其中隱含的具有重要價值的信息,那么數據中潛在的關聯和規則也就不會被找出或利用,同時也就不能夠對數據產生規律加以把握,在教學工作中造成一定損失。如果能夠對這些存在的弊端加以解決,那么不僅能夠使現代教學管理提高到新的層面,而且可以幫助教師有效評估學生學習成績狀況,以提高學生的學習成績。所以說盡早建立完善的數據挖掘管理信息系統很有必要。
3 高校學生成績預警系統設計
我國的高校成績預警設計在當前水平上,只能對學生成績數據進行簡單的統計分析。為了滿足需要,以便于更好的管理學生學習,針對學習成績的三個基本狀態:成績相對落后、成績趨于滑落和成績潛藏問題,依此能夠及時分析學生成績水平,督促學生改進方法,提高學生成績。
現在就以成績潛藏問題來對系統的基本使用原理進行分析,并設計出相應的基本模型。成績預警系統通過挖掘學生以往成績關聯規則,確定成績的關聯規則范圍,再根據目前成績水平在此范圍進行搜索,推算學生今后的學習中隱藏問題。
(1)對成績數據進行預處理,首先將學生所處學期、學期所有課程進行編號,因為四個學年有八個學期,各學期課程應該都在10科以內,故一般情況下以兩位數表示,即“學期+課程”,這樣就有利于后續的排序。然后把歷史數據庫內數據的格式“學號+姓名+不合格課程”中的“不合格課程”依次編上號碼,如不合格課程1,不合格學課程2,…。再將成績不合格的記錄從需要處理的所有成績記錄中一一篩選出來。
(2)挖掘出概率較高的數據,設置適當的支持度,以便于找出的關聯規則不具特殊性。為了能確保能夠準確成功預警,需要排除無關規則,同時也要避免有管關預警規則被棄用,所以在進行合適的置信度定位時,既不能過于狹隘,也不能范圍太廣,在保證準確率的同時不斷提高預警水平。預警規則包括前件和后件,前件和后件分別表示前后學期的課程,每個學科作為一個項,將前件各項和后件的各項之間排好順序,后件始終排在前件之后。規則的前件和后件不可以用來表示同一學期的課程成績,相同學期課程之間的成績不能夠相互預測,只能在前件產生之后對后件即下一學期成績進行預測,隨著歷史學期成績的期數增加,預測的準確率越高。
(3)按照首步的方法預處理本學期的學生成績,在預警規則庫中進行搜索,輸出匹配項進行分析。
4 結語
隨著我國各高校實行信息化步伐的加快,高校教育中的工作效率不斷提升,管理大量數據信息的系統也就充分發揮了作用。數據挖掘的方式能將很多有用的數據在繁瑣、量大的數據庫中提取出來,作為評估教學水平和學生學習的依據,合理指導高校的管理、教學工作。成績預警系統的目的就是能夠對出現學習問題的學生及時發出預警信息,使學生在大學的學業成功完成。同時,在信息技術不斷發展今天,不斷對成績預警系統進行改進,以使其能更好的為教育事業服務。
參考文獻
[1] 李昊,周振華.基于數據挖掘的高校學生成績預警系統[J].大慶石油學院學報,2011,4(35):91-95.
篇9
【關鍵詞】 數據挖掘技術 現代遠程教育 應用
一、數據挖掘概述
1、數據挖掘過程。首先需要明確被挖掘數據的主要來源,其次要有效地處理原數據,進而詳細地了解數據采集、預處理以及發現之間存在的關系,再次要構建相應的模型,最后對模型進行改進并應用于實踐過程中[1]。
2、數據挖掘方法。第一,關聯分析。這種挖掘方法的目的就是為挖掘數據之前存在的潛在聯系,并了解關聯規則。第二,序列模式分析。對數據之間的前后關系與因果關系進行分析,在實踐數據當中找出內部事務的模式。而學習活動序列模式對問題的挖掘主要是因為數據源與挖掘模式具有一定的特殊性,仍存在諸多問題解決。第三,分類與聚類分析。輸入集主要是記錄集合與集中標記。現階段,已經有諸多分析模型被應用于實踐當中,最經典的就是線性回歸與決策樹等模型。而聚類分析方法與分類分析的規則存在一定的差異。其中的輸入集就是沒有標定的記錄,即輸入次數記錄并未進行分類。主要的目的就是按照特定規則,對記錄幾何進行劃分,同時利用顯示與隱式方式對不同類別進行描述,而且當前已經研發出多種聚類分析的工具。
二、數據挖掘技術在現代遠程教育中的具體應用
2.1數據挖掘技術在學習者個性化服務中的具體應用
為了更好地提供遠程教育個性化服務,最重要的就是分析并處理學習個體數據之間存在的差異。其中,針對參與學習個體情況予以分類和安排,以保證教學內容與進程的合理性。同時,在學習過程中,知識所表示的內容應當充分考慮學習者個性化要求展開深入地了解,為其提供具有針對性的學習形式[2]。在此基礎上,應全面評價并反饋各階段的學習效果。在此過程中,需要對學生注冊信息進行全面核實,同時還應當注重學生行為信息與課件庫等多種數據源。
通過對數據挖掘基本方法的運用,在綜合考慮學生興趣愛好以及個人情況的基礎上,合理地劃分學生的種類,進而為學生推薦相關性的課程與知識點,或者是有價值的學習資源,以保證在學生實際學習的過程中充分運用分類分析與聚類分析的方式進行調整,同時向類型不同的學生傳送相對應的學習內容。另外,針對學生問題與測試成績挖掘相互關聯的基本規則,為學生提出所沒有理解和掌握的知識內容,并給予有參考價值的學習建議,進而為其提供尚未掌握學習內容的資料,在短時間內促使學生掌握。通過對數據挖掘技術的運用,確保遠程教育可以充分結合學生具體狀況安排教學內容,實現了遠程教育作用與效率的全面提升,同時也促進了高等教育的終身化發展。
2.2數據挖掘技術在教學資源建設中的具體應用
對于教學資源建設來說,將遠程教育平臺數據庫當作最主要的數據源,同時,學習者網上學習的行為也被當作不可缺少的數據源,以保證更好地找出學習者關注程度和教學資源建設之間存在的聯系,積極構建模型,進而對教學資源建設計劃予以有效地調整,進一步增強教學資源自身質量。
以某學校直屬學院為例,對15級網絡工程專業學生網上學習的時間進行收集并當作數據源,在本學期期間,有七門課程供學生進行學習。其中,圖一代表不同課程學生上網的時間分布:
根據圖一內容可以了解到,課程二、四備受學生關注與認可。經分析與研究以后可以發現,兩門課程資源當中的案例和分析比重較大,所以,對學生的吸引力較大[3]。
結束語:綜上所述,將學生所反饋的信息有效地提取出來,構建數據模型,有機組合信息碎片形成更具價值的信息內容,因此,數據挖掘對遠程教育的發展具有重要的作用和現實意義。而遠程教育教學活動同樣也是整體,教W環節之間存在一定的聯系,這也決定其具有個性化的特征。對數據挖掘技術進行合理地應用,可以進一步完善遠程教育。
參 考 文 獻
[1] 徐麗,徐志明,陳峰等.遠程教育系統中數據挖掘技術的應用[J].景德鎮學院學報,2014(6):30-32.
篇10
關鍵詞:教學質量評估;數據挖掘;偏相關分析法
中圖分類號:TP274文獻標識碼:A文章編號:1009-3044(2012)10-2172-03
The Application Research of Data Mining in Teaching Evaluation of Independent Colleges
WU Ya-li1, YAN Xiao-liang2, YANG Dong-ying1
(1.Business College of Shanxi University, Taiyuan 030031, China; 2. Information Center of Certification and Accreditation Administration of the People’s Republic, Beijing 100020, China)
Abstract: It become more and more important to the teaching quality evaluation of the university. At first, in this paper we are based on teaching evaluation data of the independent college, analysis and mining the data of evaluation with the software of data analysis and data mining software. then we study the theory of data mining and give a new analysis mode of the data mining of teaching quality evaluation. As a result,we get main factor about teacher’s teaching quality.
Key words: teaching quality evaluation; data mining; partial correlation; linear regression
近些年來,我國獨立學院的發展為擴大高等教育資源和高校辦學規模發揮了不可忽視的作用。獨立院校側重于課堂與實踐教學,因此,教學評估是衡量高校教學質量的重要指標。然而,現在高校教學質量評估系統還存在諸多問題。多年來的教學和管理工作積累了海量的數據,但目前對這些數據的處理還停留在數據的統計和查詢階段。怎樣能更好的利用這些數據,如何對數據進行深入分析,分析的結果對教師教學工作以提供哪些更有價值的建議是目前我們要解決的主要問題。
該文以獨立學院近年來的教學評估數據為例,運用分析數據軟件(SPSS)、數據挖掘軟件(WeKa)對教師教學評估數據進行了數據分析與數據挖掘。在深入研究數據挖掘理論的基礎上,提出一種分析挖掘教學質量評估數據的新模式。實驗結果表明,該模式效果良好,有利于教學質量的提高。
1數據挖掘技術
最初數據挖掘研究的目的很大程度上是基于對市場購物籃的分析,以便管理者能更好的了解市場情況,從而針對消費者采取更有效的措施。
數據挖掘(Data Mining)[1],也叫數據開采,數據采掘等,是按照既定的業務目標從海量數據中提取出潛在、有效并能被人理解的模式的高級處理過程。在較淺的層次上,它利用現有數據庫管理系統的查詢、檢索及報表功能,與多維分析、統計分析方法相結合,進行聯機分析處理(OLAP),從而得出可供決策參考的統計分析數據。在深層次上,則從數據庫中發現前所未有的、隱含的知識
2應用研究
2.1確定挖掘對象、目標
確定數據挖掘的目標,確定數據挖掘的對象是數據挖掘的首要工作。該文中數據挖掘對象是獨立學院教師基礎信息和教學評估數據。本系統的挖掘目標是從已有教學評估指標中找出對教學評估結果影響比較大的因素,運用合理的指標模型對教師教學質量進行深入分析,最終以達到提高教學質量的目的。
2.2建立數據挖掘庫
2.2.1數據采集
1)教師基本信息
數據結構如下:教師號(TNo)、性別(Sex)、年齡(Age)、職稱(ProfeTitle)、學歷(Education)、是否專職(Ext_Full)。
2)課程與教師評估信息
內容主要包括對課程本身和教師教學方面的評估。其中評價課程的目的是評價課程設置的必要性、合理性及教材的質量;評價教師設置了教學態度(E_Tea1,E_Tea2,E_Tea4)、教學內容(E_Tea5, E_Tea9)、教學方法(E_Tea7, E_Tea8)、教學手段(E_Tea3, E_Tea6)、教學效果(E_Tea10)等十個條目,目的是評價教師的課堂教學質量。均采取量化評價的方法,數據結構表如表1:
表1課程與教師評估信息數據結構
其中課程評價總分100分,共4項,每項25分;教師評價總分100分,共10項,每項10分。課程評價和教師評價均分四個等級,并設置了A、B、C、D四個級差,其權重依次為0.95、0.7、0.6、0.4。評價總分按照公式M=∑KiMi計算得到課程評估結果(E_CourReault)和教師評估結果(E_TeaResult),其中Ki為第i個條目的權重;Mi為第i個條目的分值。
2.2.2數據挖掘庫的建立
數據預處理包括數據挖掘庫的建立、數據分析、數據轉換。數據預處理的目標是將數據進行轉化,然后在數據集中剔除不合理的信息,整合成能被數據挖掘算法利用的數據,最終存入數據挖掘庫。
該文運用一定的數據分析方法和數據挖掘技術進行數據分析挖掘。首先,為收集數據并建立數據庫。數據來源為的“教師基本信息庫”,“教學評估數據庫”。其次是教學評估數據分析,是在以上兩個數據庫的基礎上按照需求進行關聯,涉及了四個數據表:Tea_info(教師信息表)、Cour_Standard(課程指標信息表)、Tea_Standard(教師指標信息表),Eva_reault(評估結果表),其中,Eva_reault是教學體系指標編號和教師編號的關聯表.有這些表生成數據挖掘庫。主要字段包括:教師號、性別、年齡、職稱、學歷、是否專職、課程評價、教師評價、評估結果等字段。
2.3數據預處理
數據分析的目的是篩選出對評估結果影響較小的指標,進一步縮小對評估結果影響的范圍。
偏相關分析[2](Partial)是研究兩個變量的相關性的一種方法,為了找出任意兩個變量之間的關系,首先要控制與這兩個變量有聯系的其它變量,使其保持不變.在分析中,當其它變量被固定后,給定的任意兩個變量之間的相關系數,叫偏相關系數[5],它表示在其余變量保持不變時,這兩個變量之間的相依程度。
偏相關系數可以度量P個變量x1, x2…xp之中任意兩個變量的線性相關程度,而這種相關程度是在固定其余P-2個變量的影響下的線性相關。
相關系數可以度量兩個變量x1, x2之間的線性關系的程度.表達式為:
偏相關系數反映了相依關系中變量之間的相互重要性,如果x1和x2之間的相關性只是基于x3的公共影響,那么r123,≈0。這也可以看成在消去干涉變量后顯示出來的相關性。
要確定各影響因素與教學評估結果的相關程度,首先要確定一個變量來衡量教師教學質量,評估結果就是衡量教師教學質量的變量。然后計算出所有影響因素與教學質量的偏相關系數,從而剔除掉對教學質量效果影響較小的因素。
由偏相關分析可以得到屬性之間的變量值,其中每個變量對應的三個屬性值依次為:偏相關系數,實際顯著性概率,自由度數。其中,偏相關系數代表的是關系的密切程度,實際顯著性概率是使因子與教學評估結果之間的相關系數為零的假設成立的概 率,自由度數即計算時的自由度數。其中,E_Tea4與E_TeaResult的關系是最密切的,相關系數為0.691,顯著性水平為0;其次是E_Tea6,相關系數為0.651,顯著性水平為0;下來是E_Tea2,相關系數為0.599,顯著性水平為0。
分析表明影響教學評估結果的主要因素,在偏相關分析的基礎上去掉了Sex、Age、Education、ProfeTitle E_Cour1、E_Cour2、E_Cour3、E_Cour4、E_CourReault、E_Tea3、E_Tea8、E_Tea9和,這些相對影響不大的因素。
2.4數據挖掘
在偏相關分析的基礎上,采用WeKa的序列挖掘模式,支持度為70%,程序給出E_TeaResult與Ext_Full、E_Tea1、E_Tea2、E_Tea4、E_Tea5、E_Tea6、E_Tea7和E_Tea10之間線性依存關系,如圖1:
圖1評估指標依存關系圖
結果表明:
1)教學態度對于教師的質量評估起著至關重要的作用,因此,首先要端正教師的教學態度,充分認識到自己的職責和作用,發揮教師的主人翁精神,投入到教學工作中去,在學生中建立自己的威信。
2)在大力倡導素質教育的今天,教師除完成教學任務外,還要注重與在課堂上學生交流互動,進行心與心的溝通,這是一種必不可少的教育方法。
3)在大力倡導素質教育的今天,教師除完成教學任務外,還要注重與在課堂上學生交流互動,進行心與心的溝通,這是一種必不可少的教育方法。
4)獨立學院是以培養實踐人才為主教育模式,其次,枯燥的理論知識無法引起學生濃厚的興趣。因此,案例教學,將理論與實踐教學相結合,可以得到更好的教學效果。
5)不可以否認,兼職教師在獨立學院發展過程中很大程度上緩解了獨立學院師資緊缺矛盾,但他們畢竟精力有限,更重要的是多數兼職教師缺乏主人翁責任感,對教學采取應付或敷衍的態度,他們的教學方式可能從某種角度來說不適合獨立學院學生的發展。因此,學校必須加強師資隊伍建設,培養適合于自己發展的教師。
3結束語
該文基于獨立院校教學評估數據,運行數據分析和挖掘技術,將教學評估結果運用偏相關分析方法進行數據分析,采用序列模式挖掘出影響教師評估結果較大的指標以及指標之間的相關性,能夠讓學校管理者從中發現教師教學活動中的主要問題,為獨立院校教師招聘工作和教育質量改革提供有價值參考意見.同時,教師本人能夠根據自己的教學質量評估結果進行調整,從而提高自身的教學質量。
參考文獻:
[1] Agrawal R,Srikant R.Mining sequential patterns[C].Proc International Conference on Data Engjneerjng,Tajpej,Taiwan,1995:3-14.
[2]鐘曉,馬少平,張鈸,等.數據挖掘綜述[J].模式識別與人工智能, 2001,14(1):48.
[3]白雪.高校教學質量評估數據的分析挖掘系統[D].南京:南京理工大學,2007.
[4]何曉群,劉文卿.應用回歸分析[M].北京:中國人民大學出版社,2001.
[5]趙健,傅莉.數據挖掘在本科教學評估中的應用[J].高教發展與評估,2008 ,24(1):66.
[6]周峰.數據挖掘理論在高校教學評估中的應用[M].南昌:南昌大學,2009.