시험지 분석의 주요 내용은 무엇인가요?

시험지 분석 4단계: 난이도, 차별성, 신뢰성, 타당성

1. 난이도는 시험 문제의 난이도를 말하며, 이는 시험의 질을 측정하는 척도입니다. 문제의 판별과 동시에 시험지의 판별에 영향을 미치고 결정하는 중요한 지표 매개변수입니다. 일반적으로 시험 문제의 난이도는 0.3~0.7 사이로 알려져 있으며, 전체 시험지의 평균 난이도는 0.5 정도가 가장 좋습니다. 0.7 이상 0.3 이하의 문제는 너무 많지 않아야 합니다. 1. 난이도에 대한 두 가지 정의:

(1) P=1—x/w x는 특정 질문의 평균 점수이고 w는 질문의 전체 점수입니다. 이 정의에서, 난이도 값이 작을수록 시험 문제가 쉽다는 것을 나타내고, 큰 값은 시험 문제의 최소값이 0, 최대값이 1임을 나타냅니다.

(2) P=x/w의 정의에서 난이도 값이 작을수록 시험 문제가 어렵다는 것을 나타내고, 값이 클수록 시험 문제가 쉽다는 것을 의미하며 최소값은 0입니다. 최대값은 1입니다.

2. 난이도 계산:

(1) 주관식 시험 문제의 난이도

기본 공식 방법: P=1—x/w

B 극단적인 그룹화 방법 P=1—(XH+XL)∕2W XH: 높은 그룹의 평균 점수(상위 27%), XL: 낮은 그룹의 평균 점수(하위 27%).

(2) 객관식 시험 문제 난이도

기본 공식 방식: P=1-R/N R은 정답 수, N은 총 인원수입니다.

B 극단적인 그룹화 방법: P=1-(PH+PL)∕2

PH=RH/n은 높은 그룹 합격률, RH: 정답 수 상위 그룹에서 n: 전체 인구의 상위 27%입니다. PL=RL/n은 하위그룹 합격률, RL은 하위그룹의 정답 개수라고 합니다.

2. 차별은 응시자의 능력 수준을 구별하는 지표입니다. 시험 문제의 차별 정도가 높으면 응시자의 수준에 따른 점수 차이가 커져서 실력이 높은 사람은 높은 점수를 받고, 실력이 낮은 사람은 낮은 점수를 받게 됩니다. 차별의 정도는 응시자의 수준 차이를 반영하지 않습니다. 시험문제의 차별성은 시험문제의 난이도와 직접적인 관련이 있다. 일반적으로 난이도가 중간인 시험문제의 차별성이 더 크다. 또한, 시험문제의 차별성은 응시자의 수준과도 밀접한 관련이 있으며, 시험문제의 난이도가 응시자의 실제 능력과 같거나 약간 낮을 경우에만 그 차별화된 성과가 충분히 발휘될 수 있다. 변별지수 평가: -1.00≤D≤+1.00 변별지수가 높을수록 시험문제의 변별력이 강해집니다. 일반적으로 변별력 지수가 0.3 이상이면 시험 문제가 인정될 수 있다고 여겨집니다. 2. 판별 계산 방법: 기본 공식 방법: D = (H-L) ¼N (D는 판별 지수를 나타내며, H는 질문에 정답을 맞춘 높은 그룹의 사람 수, L은 낮은 그룹의 사람 수를 나타냅니다. 질문에 정답을 맞춘 그룹이며, N은 그룹을 나타냅니다. 인원수는 상위그룹과 하위그룹의 인원수를 합한 것입니다. 극단적인 그룹화 방법:

(1) 주관식 시험 문제: D=SH-SL∕n(WH-WL)

SH: 높은 그룹 점수의 총 개수, SL: 낮은 그룹 점수의 총 수, WH: 이 질문에 대한 최고 점수, WL: 이 질문에 대한 가장 낮은 점수, n은 높은 그룹(또는 낮은 그룹)에 속한 사람의 수로, 전체 그룹 수의 27%입니다. 사람들.

(2) 객관식 시험 문제: D= PH—PL 또는 D= RH—RL∕n

(3) 일반적으로 D=XH—XL∕X도 가능합니다. 계산을 만족시키는 데 사용됩니다. XH: 높은 그룹의 특정 시험 문제의 평균 점수, XL: 낮은 그룹의 특정 시험 문제의 평균 점수, X full: 문제의 전체 점수.

3. 신뢰성 신뢰성은 측정 결과의 일관성 또는 안정성을 의미합니다. 안정성이 높을수록 측정 결과의 신뢰성이 높아집니다. 반대로, 동일한 응시자를 두 번 시험하기 위해 특정 시험 문제를 사용했는데 그 결과가 첫 번째 80점, 두 번째 50점이라면 결과의 신뢰성에 의문이 생길 수 있습니다. 신뢰성은 일반적으로 두 가지 평가 결과 간의 상관 계수로 표현됩니다. 상관 계수가 1이면 시험지와 같은 평가 도구가 완전히 신뢰할 수 있음을 나타내고 상관 계수가 0이면 시험지가 완전히 신뢰할 수 없음을 나타냅니다. 일반적으로 신뢰도는 0.7 이상이어야 합니다. 1. 신뢰도 평가 방법 : (1) 검사-재검사법, (2) 중복법-하위질문, (3) 반반법, 즉 검사-재검사 신뢰도, 중복 신뢰도, 내적 일관성 신뢰성을 평가하는 방법입니다. 시험-재시험 신뢰도는 동일한 시험지를 동일한 조건에서 동일한 응시자 집단에 두 번 실시했을 때 두 평가 결과 간의 상관 계수를 말합니다.

중복신뢰도란 개념, 내용, 난이도, 문제유형, 문제량 등이 병행되는 2개 이상의 시험지를 이용한 시험결과 간의 상관계수를 말한다. 내부 일관성 신뢰도는 일반적으로 시험지를 두 개로 나눈 다음 시험지 절반과 나머지 절반 간의 상관 계수를 계산합니다.

2. 신뢰도계수 γxx=ST2∕SX2 ST2를 실제 점수분산, SX2를 구한 점수분산이라 한다. 신뢰도 계수의 최대값은 1로 검사의 신뢰도가 높음을 나타내고, 최소값은 0으로 검사의 신뢰도가 낮음을 나타냅니다. γxx ≥ 0.70이면 그룹 간 비교에 테스트를 사용할 수 있습니다. γxx ≥ 0.85인 경우 개인 간 비교를 위해 테스트를 사용할 수 있습니다.

4. 타당성 타당성은 테스트하려는 내용을 테스트할 수 있는 정도, 즉 테스트 결과가 테스트 목적과 일치하는 정도입니다. 어떤 테스트 도구라도 다른 측면에서 아무리 우수하더라도 타당성이 너무 낮고 테스트 결과가 테스트하려는 것과 다른 경우(예: 영어 시험지를 사용하여 학생의 수학적 능력을 테스트하는 경우) 현재 테스트하려는 것이 가치가 없는 것을 측정할 수 없습니다. 심리적 현상 자체의 특성으로 인해 평가의 타당성이 특히 중요합니다. 심리학은 영적인 것입니다. 현재 사람들은 그것을 직접적으로 관찰할 수 없습니다. 단지 사람의 행동 패턴이나 시험 문제에 대한 반응을 통해서만 그 사람의 심리적 특성을 추론할 수 있을 뿐입니다. 예를 들어, 지능 수준은 주로 몇 가지 질문에 대한 개인의 반응과 정확성 및 오류의 결과를 기반으로 추론됩니다. 타당도는 상대적인 개념입니다. 즉, 타당도에는 높고 낮은 수준만 있을 뿐, 모두 효과적이거나 모두 유효하지 않은 것은 아닙니다. 타당도는 유형 타당성, 내용 타당성, 구성 타당성, 예측 타당성, 시간적 타당성으로 나눌 수 있다.