開放試題如何評分
 
  發布時間:2010-07-13    點擊次數:7708

 

作者:雷新勇 周群    文章來源:《考試研究》20081 

    大規模教育考試試題命制是以心理學的某些理論假設為基礎。與這些理論假設一致的試題定義要求試題應該具備三個要素:測量目標、刺激情境和設問,這三個要素缺失了任何一個,都不能構成完整的試題。根據這些理論假設以及試題定義和要素,本文討論了命制客觀題和主觀題的基本要求,客觀題包括題干的要求、選項設置的要求以及選項數的問題;主觀題包括情境材料的選擇、設問、賦分和評分標準制定。每年高考和中考結束后,只要仔細推敲各省市的試題,就可以發現許問題。針對這些問題,作者試圖從考試命題的心理學基礎入手,根據試題的定義,提出試題的基本要素,以及試題命制的基本技術。

一、試題命制的心理學假設

    大規模教育考試以若干個心理學假設為理論基礎。

(一)人的心理特質是存在的

    心理特質是心理學上用來描述人的心理特征的一個抽象概念,它是指一個個體與其他個體不同的、可以識別的、相對穩定的特征(Cohen R.J.2005)。例如,人的智力、認知方式、適應性、興趣、態度、價值觀、一般個性、特殊個性等,都屬于心理特質的范疇。大規模教育考試中常常將心理特質稱為心理結構或能力。考試的目的就是要推測考生的能力,或者說推測考生的心理結構。如果沒有這樣一條心理學假設,考試就失去了目標,就沒有存在的必要。

    心理特質、心理結構或能力是抽象的心理學概念,是看不見、摸不著的,但是我們可以通過觀察的方式,識別人的心理結構或能力的存在及存在的強度。觀察的方法有多種多樣,大規模教育考試就是通過測試(Testing)的方法,即通過考生的應答過程和應答結果來推測考生心理結構或能力的存在強度。

 

    心理結構或能力是人相對穩定的特征,是指人表現出某種心理結構或能力具有環境依賴性,即人并非在任何環境下,都能表現出某種心理結構或能力,只有在特定的環境下,人才能表現出某種心理結構或能力。因此,當我們用測試的方法來推測考生的心理結構或能力時,必須創設某種環境,讓考生在這種環境中,順利地表現出我們期望其表現的心理結構或能力。這種環境就是試題的題干。本文后面提出的關于命制試題的若干要求,其理論基礎也在于此。

(二)心理特質是可以量化、可以測量的

    如果心理特質,或者心理結構或能力,不可以量化,不可以測量,大規模教育考試就不能通過考試給考生賦分,也就不能以考試結果作為選擇學生的依據之一。

    既然心理結構或能力是可以量化、可以測量的,那么在進行量化或測量時,首先需要對測量的心理結構或能力進行定義,以便對考試結果――分數的內涵作出合理的解釋,同時也需要進一步向考生說明,將從哪些方面來觀察考生是否具備這些心理結構或能力,或者依據什么證據來推測考生是否具備這些心理結構或能力,即必須對考試的行為目標或認知目標進行定義。同時要確定如何觀察,用客觀題觀察,還是用主觀題觀察。用什么規則對考生的應答過程和應答結果――考生在考試中的表現――進行賦分,哪些認知目標是高級的目標,是否需要給予其更大的權重,即是否要賦予其更高的分值。

(三)與考試相關的行為可以預測非考試相關的行為

    根據考生在考試中的表現,推測考生的心理結構或能力,目的是要預測考生在非考試環境下的表現或行為。高校招生中,以高考分數為依據,就是認為高分的考生能力強,能夠適應未來高校的學習環境。如果考試不能預測非考試相關的行為,那么大規模考試就沒有存在的必要了。

    當然,要使考試能夠預測非考試相關的行為,考試創設的環境就必須與非考試環境相聯系。例如,高考是為高校錄取新生服務的,根據考生在高考中的表現,可以預測考生未來在澳门真钱赌场网投環境下的行為,那么高考創設的環境必須與未來澳门真钱赌场网投的環境相聯系。因此,大規模教育考試的命題中,我們不但對試題要有能力方面的要求。也還要有學科知識方面的要求。如果考試僅僅考慮行為目標,或認知能力,而不考慮學科知識,試題以及考試創設的環境就不可能真正地與未來澳门真钱赌场网投的環境相聯系。

 

(四)每一種測試方法或技術都有其優勢和局限

    推測考生心理結構或能力時,可以采用不同的觀察方法,如紙筆考試、面試、表現性測試、課堂觀察、活動觀察等。每一種觀察方法都有其優勢和局限,沒有一種方法絕對優于另外一種方法,關鍵在于考試分數的使用者關注什么。例如,紙筆考試的結果可比性很好,但相對而言,不太容易考察考生思維的發散性、思維的敏捷性等素質;而面試正好相反。究竟是紙筆考試好,還是面試好,不能一概而論,如果考試結果的使用者關注的是可比性,那么可能就需要選擇紙筆考試,這就是紙筆考試一直受到青睞的原因之一。同樣,紙筆考試中,不同的測試方法也各有千秋。客觀題有客觀題的優勢和局限,主觀題也有其優點和不足。認識這一點,可以使考試的設計者、命題者科學地使用不同的考試方法和題型。

(五)測量過程中必然會產生誤差

    在大規模教育考試中,誤差是指考試欲測量的心理結構或能力以外的因素所產生的效應。大規模教育考試中,考生的行為表現――考試得分――除受到欲測量的心理結構影響外,還受到其他一些因素的影響,如考試當天考生生理狀況,評分教師評分誤差的影響等。

    大規模教育考試中,測量誤差是客觀存在的,只能盡量減小,但不能最終消除。因此,在考試設計、命題、考試結果的使用和評價,必須考慮測量誤差。

(六)測試和評價可以是公平的、無偏的

    這是教育考試和心理測量領域爭議最大的一個假設。公平、無偏就是要平等地對待每一個考生,無論其性別、民族、居住地如何,要使考生與測量的心理結構無關的個性特征對考試結果以及結果的解釋沒有明顯的影響。公平、無偏的關鍵在于讓所有考生同等地獲得關于考試的信息,在于考試中要盡可能采用多種方法對考生進行測量,在于命題時選擇的材料不偏不倚,在于試題的表述簡單、明了。

二、試題的基本定義和組成要素

(一)試題的基本定義

    根據Osterlinter1990A),試題的定義為:在教育和心理特質測試中,試題是一個測量單元,它具有刺激情境和對應答形式的規定,它的目的是要獲得被試的應答,并根據應答對考生的某些心理特質方面的表現(如知識、能力等)進行推測。(A test item in an examination of mental attributes is a unit of measurement with a stimulus and a prescriptive form for answeringandit is intended to yield a response from which performance in some psychological constructsuch as an knowledgeabilitypredispositionor traitmay be inferred.

    這個定義包含了試題的全部條件,是比較完整的,它既可以滿足心理測量中試題的要求,也可以滿足教育測量中試題的要求,并且該定義適合于所有題型試題的要求。因此,是普遍承認的一個試題定義。

    對這個試題定義,我們可以從三個方面理解。首先“,試題是一個測量單元”關注的是試題的測量功能。測量就是要定量化(quantification),能夠以某種方式生產出定量的數據。因此,任何一道試題要對考生的行為表現進行賦分,并且應該按照心理結構或能力的行為表現目標進行賦分,否則,就不可能對考生的心理結構進行有效的推測。

    其次,“試題具有刺激情境和對應答形式的規定”意指考生心理結構或能力的表現具有環境依賴性,命題者必須創造一個讓考生心理結構或能力得以表現的環境。試題的刺激情境,就是這樣的一個環境。此外,考生對試題作出應答必須按照試題的要求進行,因為考生對某種刺激產生的反應可能是多種多樣的,如果不規定考生應該作出什么樣的反應,就難以獲得需要的推測考生心理結構或能力的數據,包括應答過程和結果的資料,以及考試分數數據。

    第三,“根據應答對考生的某些心理特質方面的表現(如知識、能力等)進行推測”說明了試題的根本目的。心理結構或能力是理論上的概念,我們必須找到一種方式來推測某一心理結構或能力的存在以及考生展示這一心理結構或能力的相對程度。試題就起到了這一作用。如果一個試題的刺激情境不能提供推測某一心理結構或能力的數據,或者試題沒有明確的要測量的心理結構或能力,就不能稱之為試題。

(二)試題的基本要素

    根據上述試題的基本定義,可以確定一道試題必須要有三個基本要素。

1.測量的心理特質――測量目標

 

    試題測量哪一種或兩種行為目標或認知目標,完成這些行為目標需要涉及哪些學科的知識內容,這是試題的第一要素,缺失了這個要素,試題就缺失了靈魂,失去了測量學意義,測量的結果即是與測量的心理結構或能力無關的結構或能力,對考試結果的解釋和使用也就沒有價值。

2.刺激情境――情境材料

    情境材料也是試題的基本要素,它的作用是對考生進行刺激,產生讓考生表現心理結構或能力的環境。

3.對應答的規定――設問

    情景材料對考生產生的刺激可能是多方面的、多樣的,考試不可能讓考生將所有這些反應都寫出來,時間不允許,也沒有必要。我們只需要考生將我們期望能夠推測其心理結構或能力的反應寫出來即可。因此,必須通過設問來引導考生作出規定的應答。好的設問能夠恰當地引導考生表現出期望的行為,而不恰當的設問可能達不到這個效果,甚至會引導考生表現出其他的,非期望的行為,從而不能對要測量的心理結構或能力進行推測。

三、客觀題命題的基本技術

   本文以最常用的選擇題為例,討論客觀題的基本命題技術。

(一)客觀題題干基本要求

   根據試題的定義和基本要素,命制選擇題時,對題干應該遵循下列基本要求。

1.每一道試題必須涉及一定的內容領域和單一的認知行為考試效度的最大威脅來自試題測量無關的心理結構。如果一道試題沒有確定的行為目標,或者行為目標與考試預設的測量目標及其行為目標不一致,那么這道試題不但對提高考試的效度無補,反而會降低考試的效度。

    同理,高考是為高校選拔人才服務的,考試創設的環境必須與未來澳门真钱赌场网投的環境相聯系,因此,每道試題需要考生在一定的學科領域完成任務,表現出一定的認知能力。如果完成任務過程不能使用一定的學科知識,那么該試題創設的環境就不能與未來的澳门真钱赌场网投環境相聯系,也就是一道無效的試題。因此,試題必須能夠測量某一認知行為,涉及一定的學科內容領域,這是命制試題時必須認真考慮的。

 

    按照這一要求,例1就是一道無效的試題。

 

1:下列敘述正確的是

A.同主族金屬的原子半徑越大熔點越高

B.稀有氣體原子序數越大沸點越高

C.分子間作用力越弱分子晶體的熔點越低

D.同周期元素的原子半徑越小越易失去電子

    這道題的主要問題是沒有測量目標,沒有刺激情境,按照試題的定義,不能構成為試題。

2.試題考查的應該是重要內容,不要考很次要或不重要,或大家幾乎都會的內容

 

    大規模教育考試是抽樣測評,理論上我們應該要求考生盡可能多地完成試題,這樣才能對考生的心理結構或能力作出比較有效的推測。但是,由于時間的限制,我們要求考生完成的試題僅僅是所有可能的學科試題集合中很少的一部分。我們需要用這很少一部分試題來推測考生的心理結構或能力。從測量的角度看,就是用一個相對較小的樣本作出推測。因此,選擇的樣本必須有代表性,即試題涉及的內容領域應該是學科的重要內容,如果涉及的是次要或不重要的內容領域,那么就很難將考試結果解釋為學科能力的標志。同樣,如果試題涉及的內容領域都集中在少數重要的內容領域上,試題樣本也缺乏代表性,對考試結果解釋也存在局限。

3.用新情境材料考查高水平的認知能力,不要用與教材語言相同的材料,以免考查學生的簡單記憶能力

 

    高水平的認知能力是指分析、概括、綜合、推測、評價等能力。一般考查考生這些高水平能力時,需要將考生置于新情境材料中,讓考生對其進行分析、概括、綜合、推測和評價。如果用考生熟悉的情境材料或用與教材語言相同的材料,考生很可能會憑著記憶,完成所要求完成的任務,導致僅僅考查考生的簡單記憶能力,考試結果不能反映考生的高水平認知能力。

 

4.每道試題內容要互相獨立

 

    試題之間互相獨立是教育測量學的一個基本要求,所謂互相獨立是指試題之間不要有互相提示和互相依賴關系。互相提示關系比較容易理解,命題教師一般容易接受,但往往不被重視。例如,有些英語試卷中,在閱讀理解部分的閱讀材料的某些句型、結構等會對前面的語法詞匯部分的某些正確選擇起提示作用,也可能會對某些句子的翻譯起提示作用。這對于相關內容的考查是不利的,應引起命運人員的關注。

5.避免過于專門或過于一般的內容

大規模教育考試涉及的內容應該以考生高中階段所學的學科知識為基礎。過于專門的內容往往容易超過大多數考生的認知范圍而過于一般的內容考生往往不需要經過思考憑常識就可作出應答這樣的試題實際上都降低了試題的效度考查的是與考試無關的心理結構或能力。例2是一道過于專門的試題氫作為一種能源其制作工藝特點現在的考生一般無從知曉。

2氫能是一種高效、干凈的新能源用氫作能源的燃料電池汽車備受青睞。我國擁有完全自主知識產權的氫燃料電池轎車超越三號已達到世界先進水平。氫能具有的優點是

①原料來源廣      ②易燃燒、熱值高

③儲存方便       ④制備工藝價廉易行

A.①②        B.①③

C.③④                D.②④

3是一道過于一般的試題考生幾乎均可以憑借常識判斷正確選項是D

3右圖喻示管理學中經典的木桶原理即木桶的蓄水量是由最短的那塊木板決定的。它蘊涵的哲理是
     A.量變引起質變

B.事物發展是不平衡的

C.世界是發展變化的

D.整體離不開局部

6.避免試題純粹以個人認識為基礎

選擇題的題干內容應該以客觀事實性材料、科學原理或哲理材料為基礎而不應以個人認識或意見為基礎否則很難讓考生作出正確的判斷從而影響考查的效果。例4就是一道以個人認識為基礎的試題按照命題者的主觀認識正確答案應該是C。但是如果有些考生根據我國處理與南海周邊國家關于南海領水爭端的做法擱置爭議共同開發認為BD兩項都正確那又有什么不可呢?

4海洋蘊藏著豐富的生物、能源、礦產等資源是一個國家生存發展的重要戰略空間海洋權益是敏感的國際地緣政治問題。為此我們應首先(   )。

A.開辟更多的海上航線

B.大力開發利用海洋資源

C.維護國家海洋主權

D.加快發展海洋經濟

7.應答所要求的思維過程不要過于復雜

考試是根據考生應答的過程和結果來推測考生心理結構或能力。對于選擇題而言只能看到應答的結果看不到應答的過程。對于過于復雜的應答過程一般而言只有一部分是我們真正要考查的過程其他部分可能不是試題真正要考查的過程但由于這些部分也比較復雜往往會使考生在這些部分發生錯誤而在真正要考查的部分考生并不一定錯。這樣試題往往就不能有效地考查預測的心理結構或能力。

8.題干中不要包括無關的內容

題干中不包括無關的內容是語言簡潔、明確的需要也是創設有效的試題環境的需要。題干中包括無關內容實際上是對考生產生了無效刺激而這種刺激又與要考查的心理結構或能力無關這樣做一方面干擾了考生作出正確的心理反應另一方面也降低了試題測量的有效性降低了考試結果解釋和使用的效度。

四、主觀題命題的基本技術

主觀題命題包括四個重要環節即選擇題干情景材料、設問、賦分和制定評分標準。

試題情景材料選擇的基本要求

題干情景材料是對考生進行刺激產生讓考生表現心理結構或能力的環境。因此選擇題干情景材料需要考慮的基本要素是試題期望測量的行為目標、涉及的內容領域以及考生對材料的理解能力。

  1. 挑選的情景材料應該與學生學習經歷過的材料有類似性但并不相同

如果使用的材料考生很熟悉或者在平時的復習訓練中經常用到過測量的行為目標就可能轉化為測量記憶內容這樣測量結果的效度就會降低試題可能會測量無關的心理結構。材料在形式或在內容主題上與考生復習訓練中見過的材料不相同但涉及的概念、原理、獲取信息的方法、解決問題的方法等應該是相同的或相似的可以用材料來考查設計所要考查的心理結構的行為目標。在課本、報紙、新聞、學術刊物、研究生論文和各種參考材料中挑選一部分進行修改一般可以獲得滿足要求的材料。可見要獲得比較理想的材料需要命題教師了解學校的教學和學生的學習生活、社會生活。

2. 挑選的情景材料應該有教育意義

盡管試卷和試題不是教材但它們仍然承載著教育功能。我們面對的考生世界觀、價值觀、人生觀尚未定型還處在人生的發展、變化的階段而大規模教育考試是高利害考試考生對考試中閱讀的每一道試題的材料的印象可能遠比其他材料深刻這種材料可能會對考生產生更大的影響。因此選擇的試題情景材料應該有教育意義。

9 是某英語考試中選擇的英文聽力材料。這段材料的大意如下

Hogg 先生失業兩周了一直未找到工作。一天晚上在回家的路上遇到持槍搶劫者要求他交出錢財。Hogg 先生告訴搶劫者他失業了口袋空空身無分文今天一天尚未吃東西又沒錢。搶劫者聽了他的敘述后放下槍給了他5 元錢并說我也是失業者就走了。

9 Mr. Hogg was on his way home. He had been out of work for two weeks and could not find another job. Today he hadn’t had anything to eat and he had no money in his pocket. Suddenly a thin man with a gun in his hand appeared in front of him. ”Don’t move or shout. Put hands on your head. Give me your money. “ The man said. Hogg didn’t deare to move. ”But I haven’t hot any. “ Hogg said.With these words he pulled out his pockets, and they were all empty. The man didn’t believe him. So Hogg told him everything. After hearing his story, the man put the gun away and took out five dollars, saying, ”We are in the same boat. Take this.” After he put the money into Hogg’s hand, he went away quickly. Hogg watched the man disappearing in the darkness. With the money in his hand, Hogg didn’t know what to do or what to say.

這則材料雖然本身有點幽默但在目前我國現實的背景和教育環境中這則材料不能對考生起到正面的、積極的教育引導作用。命題者選擇材料時缺乏對材料教育意義的思考。

3. 情境材料選擇必須考慮測量的認知目標和涉及的內容領域

設計主觀題首先要考慮試題準備測量什么行為,該行為特征與哪個測量目標相關,希望考生用什么內容領域知識來解決問題。如果這幾個要素不明確,就不能開始編制試題,選擇材料就會帶有盲目性。在實際命題過程中,相當多的命題教師在選擇材料時,并未考慮要測量的行為目標,一般考慮較多的是要考什么學科內容。這樣選擇出來的材料往往不能測量設計的行為目標,達不到命題要求,工作效率也很低。因此,命題要以測量的行為目標為導向。

如果試題的情景材料以及相關問題不能引導考生表現出相應的行為,不能為評價考生的能力提供數據,它就不能成為試題或不能成為好試題。

大規模教育考試要求考生在考試中不但要表現出特定的認知行為,而且在完成試題規定的任務過程中,應該用到相關的學科內容領域的知識,如果考生在完成任務過程中,不用到相關學科內容領域的知識,那么表現出的行為就是一般的行為,是源自生活常識的行為,不是與學科領域相關的特殊行為,考試的效度就會受影響。因此,選擇材料時可以參考課程標準規定的學習的主題材料。

4. 情景材料應該不含新的概念、原理和方法,或者所含新的概念、原理和方法等不影響考生對材料的理解

考生經過情境材料刺激后,表現出的差異只能與要測量的認知目標和相應的行為目標、相關的內容領域的知識相關,與其他任何因素無關。例如,考生對材料的理解不應該受到其背景知識、生活經歷差異的影響。因為不同考生其興趣、家庭生長環境、生活地域環境、文化環境等不同,其背景知識、生活閱歷、見識等均不會相同,如果考生對材料的理解受到背景知識、生活經歷的影響,就必然會出現對部分考生有利,對部分考生不利的情況,就會產生實質的不公平。因此,材料對科學、社會、文化、歷史、地理等方面問題的討論只能在考生學科知識的范疇內進行。否則,考生的行為就受到無關的心理結構的影響,產生試題功能偏差,考試結果的效度就會降低。

有些命題教師和學科秘書認為,考生處理情景材料的能力,也能反映考生能力的差異。這種說法沒錯,問題在于試題究竟是測量考生處理材料的能力,還是其他能力。如果是前者,那么考綱中必須明確這一點。然而,即使是這樣,也不能每道試題都考查考生處理材料的能力,這樣的試題一定會測量多個行為目標,會產生試題功能偏差。

5. 情境材料的呈現方式應該多樣化

試題的背景材料有很多種類,如文字材料、各種數據示意圖、原理圖、結構圖、地圖、數據表格、照片等實物、實景圖片等。試題的背景材料應該多樣化,應該適當地使用圖示材料或圖表材料。這樣一方面可以使試卷卷面更加活潑、美觀,增加試卷的親和性,提高考生的興趣,使考生不至于因閱讀大量文字材料感到疲勞、乏味,影響水平的發揮。情境材料以不同形式出現,可以使某個方面偏強的考生不會太討巧,某些方面偏弱的考生也有機會彌補其薄弱環節。如果材料既可以用文字形式表示,又可以用圖示形式表示,而且不同形式的材料都可以很好地服務于試題測量的行為目標,且材料都為考生所熟悉,那么最好選擇對材料加工要求最低的材料,如果對材料信息的處理能力不是試題要測量的行為目標的話。

6. 應該用清晰、明確的語言表述情境材料

用清晰、明確的語言表述情境材料是為了使考生真正理解情境材料。主觀題沒有確定的回答選項,也就缺少了有助于學生明確命題者意圖的信息來源。因此,清晰、明確的背景材料對于主觀題尤其重要。如果情境材料表述不明確,考生就難以從中獲得非常清晰的解決問題所需要的信息,難以表現出高水平的行為特征,或表現不出期望的行為特征。

7. 情境材料應該足夠復雜

情景材料有一定的復雜程度,一方面可以防止考生簡單地重復材料的話語;另一方面,有助于考生表現出其寫作水平。考試中使用主觀題除了要考查考生的較高能力外,另一個重要目的在于讓考生發揮其書面表達或交際能力,促進考生書面交際能力的發展。

(二) 試題設問的基本要求

試題的設問本質上是對考生受到情景材料刺激后,應該做出什么反應做出規定。

1. 設問或試題設計必須考慮測量目標和內容領域

測量目標是試題的核心,內容領域是由考試的性質決定的。試題的測量目標和內容領域應該與考試的內容規范保持一致。在試題的測量目標和內容領域與考試的內容規范無法完全保持一致的情況下,要考慮對考試的內容規范作適當調整或修改。

很多命題教師在設計試題時,習慣從學科內容領域出發,而不是從測量目標的行為目標出發,這對于根據考試結果推測考生的心理結構——能力是非常不利的,因此命題中應盡量避免此類情況。

 

2. 要用與測量目標相一致的動詞進行設問

每個設問中必須要有動詞,動詞的類型取決于測量目標或行為目標。表1 列出了布盧姆認知領域主要類型及描述的行為動詞。由于大規模教育考試的測量目標及其行為目標一般都是認知目標或認知行為,這些動詞對于撰寫主觀題的設問,保持設問與測量目標及其行為目標的一致性,非常有參考價值。

1 布盧姆認知領域主要類型及描述的行為動詞

 

類型

含義

反映了解行為的動詞

1.知識

再認或回憶事實或專門的知識

定義(define)記錄(record)命名(name

記憶(memorize)列表(list)聯系(relate

重復(repeat)回憶(recall)陳述(state

2.理解

解釋、轉換、概括或釋義信息

重新說明(restate)講述(tell)確定(位置)(locate

討論(discuss)評述(review)確認(identify)描述(describe

報告(report)表述(express)再認(recognize)解釋(explain

3.應用

在與初始學習背景不同的情境中使用信息

轉換(translate)采用(employ)改編(dramatize

解釋(interpret)使用(use)實踐(practise

應用(apply)證明(demonstrate)闡明(illustrate

操作(operate)規劃(schedule)概述(sketch

4.分析

將整體分解為部分,清楚地了解各部分之間的關系

分類(classify)辨別(differentiate)實驗(experiment)區分(distinguish

評估(appraise)試驗(test)分析(analyze)計算(calculate

比較(compare)對照(contrast)批評(criticize)左圖(diagram

提問(question)聯系(relate)檢驗(examine)轉換(translate

解釋(interpret)記錄(inventory)檢查(inspect)辯論(debate

5.綜合

組合各個部分形成與原來各部分不同的新的整體

綜合(synthesize)創作(compose)計劃(plan)提議(propose

設計(design)(確切地表達)(formulate)構建(construct

創造(create)安裝(set up)組織(organize)控制(manage

預計(prepare)整合(integrate)預測(predict

概括(summarize)裝配(assemble)收集(collect)安排(arrange

6.評價

根據標準或理念進行決賽、判斷或選擇等行為

判斷(judge)評估(appraise)評價(evaluate)評級(rate

比較(compare)評分(score)修改(revise)賦值(value

選擇(select)測量(measure)估算(estimate

測評(assess)選擇(choose

有些學科對不同的測量目標,有專門的設問類型。例如,英語閱讀中,測量考生識別語篇中的細節能力的設問常常采用:

What causes …… ?

Why does the author mention ……?

測量考生歸納語篇的主旨大意能力的設問常常采用:

The main idea of this passage is ……

This passage tells us ……

Which of the following statements best expresses the main idea of the passage ?

3. 應該用清晰、明確的語言表述設問

用清楚、明確的語言表述設問是為了使考生真正理解試題的意圖。如果設問表述得模棱兩可,某些已經達到了期望的測量目標的學生可能會產生誤解,表現不出試題要引導的認知行為,不能作出正確的回答。這實際上是無關的心理結構對考生的應答產生了影響,也就降低了試題的效度。如果試題設問設計得好,便可在確定的行為特征和內容領域內,很好地測量考生的能力,試題的測量結果就會有比較好的效度。

 

 

 

 

 

 

 

 

 


         
 

【關閉窗口】

版權所有 澳门网投 所有內容未經授權不得轉載或作其它使用
030059
澳门网投