목차
Ⅰ. 서 론
Ⅱ. 본 론
1. 듣기 평가의 개념 및 관련 논의
2. 듣기 평가의 내용 검토
3. 바람직한 평가요건에 대한 논의
4. 바람직하지 않은 평가에 대한 논의
Ⅲ. 결 론
참고문헌
Ⅱ. 본 론
1. 듣기 평가의 개념 및 관련 논의
2. 듣기 평가의 내용 검토
3. 바람직한 평가요건에 대한 논의
4. 바람직하지 않은 평가에 대한 논의
Ⅲ. 결 론
참고문헌
본문내용
고려할 수 있다. 평가 내용이 교육의 목표나 내용과 일치하지 않거나 교육 내용의 범위를 균형 있게 포함하지 못한 경우에는 평가계획서를 면밀하게 작성하고 평가 전문가의 검토를 받아 수정하거나 보완하여야 한다. 수험자가 평가에 대해 잘못 이해하고 있거나 불성실한 태도를 견지하는 경우 또는 지시문을 바르게 이해하지 못한 경우 안면 타당도가 낮을 수 있다. 특정 집단에서는 높은 변별도를 보인 문항이 다른 수험 집단에서는 좋지 않은 문항들로 나타날 때 평가목적에 맞는 집단으로 재선정하여야 한다. 평가 기준이 복잡하거나 부적절할 때 평가 결과는 일관성이 부족하거나 부적절하며, 평가 내용과 방법이 적절해도 평가 기준이 부적절하다면 타당도가 낮을 수 있으므로 이를 극복하기 위하여 평가 기준을 잘 정하고 그 기준에 부합하는 문항이나 과제가 유기적으로 결합되어야 한다.
(2) 신뢰도에 대한 검토
신뢰도는 평가의 결과가 얼마나 일정하게 나오느냐에 관한 것으로 어떤 시험이 신뢰성이 있다는 것은 시험 점수를 통해서 추론해야 하는 수험자의 능력을 믿을 수 있다는 것을 의미하며, 채점자나 평가 문제 자체에 의해 결정된다. 어떤 특정한 목적으로 볼 때 전혀 타당하지 않은 평가도 신뢰도는 높을 수 있다. 발음 평가에 대해 4지 선택형 지필 시험의 경우 타당도는 낮지만 신뢰도는 높다. 통계상 타당도의 계수는 신뢰도 계수보다 높게 나오지 않는 것이 일반적이며, 신뢰도가 매우 낮지만 타당도가 높은 평가는 존재하지 않는다.
① 신뢰도의 종류
신뢰도의 종류에는 하나의 평가에 대해 여러 사람이 채점을 하는 경우 각 채점자들이 주는 점수가 비슷하거나 다른 정도를 의미하는 채점자간 신뢰도가 있다. 각 점수 간의 편차가 적다면 일정성이 있다고 하며, 채점자간 신뢰도가 높다. 일반적으로 객관식 평가에서는 매우 높게, 주관식 평가에서는 낮게 나오는 것이 일반적이다. 한 채점자가 시간적 간격을 두고 여러 수험자의 답안지를 채점하는 것이 채점자내 신뢰도이다. 먼저 채점한 채점 결과와 나중에 채점한 결과를 수험자별로 상관 시켜 상관 계수를 구한다. 어떤 평가를 반복적으로 시행했을 때 비슷한 결과가 나오는 정도를 가리키는 것이 평가 자체 신뢰도이다. 어떤 집단에 대해 여러 번 동일한 평가를 실시했을 때 개별 수험자의 점수와 석차가 변하지 않고 수험자 간 점수 편차가 큰 경우를 평가 자체의 신뢰도가 높다고 한다.
② 신뢰도를 확보하기 위한 구체적 방안
평가 문항 수가 많으면 수험자가 큰 편차를 가지고 넓은 범위에 존재할 가능성이 크다. 평가 문항 수가 많을수록 평가의 신뢰도는 높아지지만 한계점도 존재한다. 난이도가 한 쪽으로 치우치면 개인의 분리도를 확보할 수 없게 되고 평가의 신뢰도가 낮아진다. 난이도가 높으면 낮은 쪽으로 분포하여 바닥효과(floor effect)가 발생하고 난이도가 낮으면 높은 쪽으로 분포하여 천장효과(ceiling effect)가 발생한다.
③ 타당도와의 관계
신뢰도와 타당도는 모두 높아야 하지만 불가피하게 긴장상태가 되기도 한다. 말하기 평가의 경우 주관식 평가가 타당도가 높지만 채점 신뢰도가 낮아진다. 객관식 선택형으로 시험을 실시하면 신뢰도는 높아지겠지만 타당도에 손상이 올 수 있으므로 타당도와 신뢰도 간 적절한 균형을 유지해야 한다. 각 기능별로 평가 도구를 별도로 마련하여 전체를 하나의 세트 속의 일부로 간주하도록 해야 한다.
(3) 실용도에 대한 검토
실용도란 평가가 실제 상황에서 효과적으로 시행될 수 있는 여건의 구비 정도로 평가 시행 여건의 충족도라 할 수 있다.
4. 바람직하지 않은 평가에 대한 논의
(1) 바람직하지 않은 평가문항에 대한 검토
바람직하지 않은 평가 문항은 어법상 어색하거나 틀린 언어가 포함된 지문이나 대화문이 있는 문항, 언어 사용의 상황이 너무 특이하거나 부자연스럽거나 억지스러운 문항, 투입 자료(지문)를 보지 않고도 답할 수 있거나 극히 일부만 보고도 답할 수 있는 문항, 선택지의 분석만으로도 답할 수 있는 문항 (그림보고 대화 맞추기), 시험 치는 기술의 훈련에 의해 기계적으로 답을 찾을 수 있는 문항, 원문을 너무 손질하여 원문의 가치가 훼손된 지문이 포함된 문항, 해마다 출제되는 문항 유형에 맞추기 위해 지문을 무리하게 개작한 문항, 깊이 생각할 필요 없이 단편적 지식의 암기만으로 답을 찾을 수 있는 문항, 너무 쉽거나 너무 어려워서 변별도가 매우 낮은 문항, 문항 지시문이 불분명하거나 애매모호하여 수험자에게 혼란을 줄 수 있는 문항, 지엽적인 내용이나 특수한 이론, 특정한 세계관을 강요하는 문항, 문제 풀이의 과정이 지나치게 복잡하거나 많은 단계가 필요한 문항 등이 이에 해당한다.
(2) 바람직하지 않은 평가사례에 대한 검토
바람직하지 않은 평가사례로 한국어 능력시험 제41회 43~44번이 있다. <한국어 능력시험 제41회 제43∼44번 제시문> “(전략) 이 유리구슬은 신라 시대의 지배층이 사용한 목걸이에 달려 있던 것이다. (후략)”으로 나와 있고 <선택지>에서 “이 유리구슬은 상위 계층이 사용했다”로 제시되었다. 이 문항에서 단서가 제시문의 첫 문장에 나오나 이후 이에 대한 어떠한 부가 설명도 없다. 학습자들은 이 문항을 해결하기 위해서는 맥락 파악을 돕는 담화표지나 여타맥락 정보들이 주어지지 않은 상태에서 해당 부분을 선별하여 듣고 기억해야 한다. 이러한 단서 구성은 듣기 이해 능력보다는 집중력 또는 기억력 평가에 해당한다고 할 것이어서 제시문에서 보여주는 단서의 배치는 학습자의 듣기 과정을 고려한 것이라 보기 어렵다.
Ⅲ. 결 론
듣기교육의 목표에 따라 습득된 듣기 능력이 어느 정도 수준에 도달하였는지를 측정하는 듣기평가는 타당도, 신뢰도, 실용도를 평가요건으로 한다. 이 요소 중 하나라도 결여하게 되면 그 평가는 바람직하지 않은 평가가 된다.
참고문헌
1. 고경민, “외국어 교수법의 변천과 한국어교재와의 상관성에 대한 연구- 전통적 교수방식에서 직접식 교수법까지 -”, 한말연구 제52호, 2019.
2. 박정은 · 장미정, “한국어 듣기와 읽기 평가 세부 정보 파악하기 문항의 선택지 제 시 방법 연구”, 한국어문학회, 2019.
(2) 신뢰도에 대한 검토
신뢰도는 평가의 결과가 얼마나 일정하게 나오느냐에 관한 것으로 어떤 시험이 신뢰성이 있다는 것은 시험 점수를 통해서 추론해야 하는 수험자의 능력을 믿을 수 있다는 것을 의미하며, 채점자나 평가 문제 자체에 의해 결정된다. 어떤 특정한 목적으로 볼 때 전혀 타당하지 않은 평가도 신뢰도는 높을 수 있다. 발음 평가에 대해 4지 선택형 지필 시험의 경우 타당도는 낮지만 신뢰도는 높다. 통계상 타당도의 계수는 신뢰도 계수보다 높게 나오지 않는 것이 일반적이며, 신뢰도가 매우 낮지만 타당도가 높은 평가는 존재하지 않는다.
① 신뢰도의 종류
신뢰도의 종류에는 하나의 평가에 대해 여러 사람이 채점을 하는 경우 각 채점자들이 주는 점수가 비슷하거나 다른 정도를 의미하는 채점자간 신뢰도가 있다. 각 점수 간의 편차가 적다면 일정성이 있다고 하며, 채점자간 신뢰도가 높다. 일반적으로 객관식 평가에서는 매우 높게, 주관식 평가에서는 낮게 나오는 것이 일반적이다. 한 채점자가 시간적 간격을 두고 여러 수험자의 답안지를 채점하는 것이 채점자내 신뢰도이다. 먼저 채점한 채점 결과와 나중에 채점한 결과를 수험자별로 상관 시켜 상관 계수를 구한다. 어떤 평가를 반복적으로 시행했을 때 비슷한 결과가 나오는 정도를 가리키는 것이 평가 자체 신뢰도이다. 어떤 집단에 대해 여러 번 동일한 평가를 실시했을 때 개별 수험자의 점수와 석차가 변하지 않고 수험자 간 점수 편차가 큰 경우를 평가 자체의 신뢰도가 높다고 한다.
② 신뢰도를 확보하기 위한 구체적 방안
평가 문항 수가 많으면 수험자가 큰 편차를 가지고 넓은 범위에 존재할 가능성이 크다. 평가 문항 수가 많을수록 평가의 신뢰도는 높아지지만 한계점도 존재한다. 난이도가 한 쪽으로 치우치면 개인의 분리도를 확보할 수 없게 되고 평가의 신뢰도가 낮아진다. 난이도가 높으면 낮은 쪽으로 분포하여 바닥효과(floor effect)가 발생하고 난이도가 낮으면 높은 쪽으로 분포하여 천장효과(ceiling effect)가 발생한다.
③ 타당도와의 관계
신뢰도와 타당도는 모두 높아야 하지만 불가피하게 긴장상태가 되기도 한다. 말하기 평가의 경우 주관식 평가가 타당도가 높지만 채점 신뢰도가 낮아진다. 객관식 선택형으로 시험을 실시하면 신뢰도는 높아지겠지만 타당도에 손상이 올 수 있으므로 타당도와 신뢰도 간 적절한 균형을 유지해야 한다. 각 기능별로 평가 도구를 별도로 마련하여 전체를 하나의 세트 속의 일부로 간주하도록 해야 한다.
(3) 실용도에 대한 검토
실용도란 평가가 실제 상황에서 효과적으로 시행될 수 있는 여건의 구비 정도로 평가 시행 여건의 충족도라 할 수 있다.
4. 바람직하지 않은 평가에 대한 논의
(1) 바람직하지 않은 평가문항에 대한 검토
바람직하지 않은 평가 문항은 어법상 어색하거나 틀린 언어가 포함된 지문이나 대화문이 있는 문항, 언어 사용의 상황이 너무 특이하거나 부자연스럽거나 억지스러운 문항, 투입 자료(지문)를 보지 않고도 답할 수 있거나 극히 일부만 보고도 답할 수 있는 문항, 선택지의 분석만으로도 답할 수 있는 문항 (그림보고 대화 맞추기), 시험 치는 기술의 훈련에 의해 기계적으로 답을 찾을 수 있는 문항, 원문을 너무 손질하여 원문의 가치가 훼손된 지문이 포함된 문항, 해마다 출제되는 문항 유형에 맞추기 위해 지문을 무리하게 개작한 문항, 깊이 생각할 필요 없이 단편적 지식의 암기만으로 답을 찾을 수 있는 문항, 너무 쉽거나 너무 어려워서 변별도가 매우 낮은 문항, 문항 지시문이 불분명하거나 애매모호하여 수험자에게 혼란을 줄 수 있는 문항, 지엽적인 내용이나 특수한 이론, 특정한 세계관을 강요하는 문항, 문제 풀이의 과정이 지나치게 복잡하거나 많은 단계가 필요한 문항 등이 이에 해당한다.
(2) 바람직하지 않은 평가사례에 대한 검토
바람직하지 않은 평가사례로 한국어 능력시험 제41회 43~44번이 있다. <한국어 능력시험 제41회 제43∼44번 제시문> “(전략) 이 유리구슬은 신라 시대의 지배층이 사용한 목걸이에 달려 있던 것이다. (후략)”으로 나와 있고 <선택지>에서 “이 유리구슬은 상위 계층이 사용했다”로 제시되었다. 이 문항에서 단서가 제시문의 첫 문장에 나오나 이후 이에 대한 어떠한 부가 설명도 없다. 학습자들은 이 문항을 해결하기 위해서는 맥락 파악을 돕는 담화표지나 여타맥락 정보들이 주어지지 않은 상태에서 해당 부분을 선별하여 듣고 기억해야 한다. 이러한 단서 구성은 듣기 이해 능력보다는 집중력 또는 기억력 평가에 해당한다고 할 것이어서 제시문에서 보여주는 단서의 배치는 학습자의 듣기 과정을 고려한 것이라 보기 어렵다.
Ⅲ. 결 론
듣기교육의 목표에 따라 습득된 듣기 능력이 어느 정도 수준에 도달하였는지를 측정하는 듣기평가는 타당도, 신뢰도, 실용도를 평가요건으로 한다. 이 요소 중 하나라도 결여하게 되면 그 평가는 바람직하지 않은 평가가 된다.
참고문헌
1. 고경민, “외국어 교수법의 변천과 한국어교재와의 상관성에 대한 연구- 전통적 교수방식에서 직접식 교수법까지 -”, 한말연구 제52호, 2019.
2. 박정은 · 장미정, “한국어 듣기와 읽기 평가 세부 정보 파악하기 문항의 선택지 제 시 방법 연구”, 한국어문학회, 2019.
소개글