• 欣欣普通话在线学习网分享:
  • 取消PSC命题说话中“语音错误”评分项的点滴思考

    作者:何广见 文章来源:江苏语言文字网 点击数: 更新时间:2009-11-13

        普通话水平测试(下称PSC)的第四测试题项是“命题说话”(下称“说话” ),它是PSC整个测试流程中最重要的一环,分值占到全程测试的40%。测评说话与测评单字及词语不同。应试人读单字或双音词时,语速慢,测评中每个音节都是预知的,测试员耳听眼看。应试人说话时,语速快,测评中鱼贯而出的每个音节,测试员无法预知,只能耳听无法眼看。因而说话的语音错误和语音缺陷的判定感知,要比单字及词语的语音错误和语音缺陷的判定感知难得多。测评说话的语音错误和语音缺陷,测试员常常面对的是一片模糊感知。

        测评实践的感知是模糊的,但PSC的评分系统却给出了精确要求。请看2004年的《普通话水平测试大纲》(下称《大纲》)规定:在测评应试人说话语音标准度表征时,既要精确计算应试人的语音错误,又要精确感知应试人的方音程度,然后综合错误多少及方音轻重评出分数。由于语音是模糊的,加之命题说话语音测评分值所占权重大,综合语音错误数量和方音程度轻重进行评分,《大纲》可谓煞费苦心。然而《大纲》设计者未必是测评践行者。施测实践证明,面对应试人快速的语流,既要精确计算语音错误数量,又要精确感知方音程度轻重,一心二用,测试员不堪胜任,常常顾此失彼,可谓费力不讨好。

        精确感知方音程度的同时,还要精确计算错误数量,一心二用,测试员难道真不堪胜任吗?一点不假,这是测评实践带给测试员的真切感受。以前人工测评时,应试人读100个单字,测试员一边看字,一边听音,最后两个或三个测试员常常会出现不一致的测评结果。比如100字测评下来,甲测试员认为错误有3个,缺陷有10个,而乙测试员可能认为错误有7个,缺陷有6个,丙测试员可能认为错误有5个,缺陷有15个。

        为什么会出现这样的情况?这与测试员培养机制有关。测试员一般都是经过短期培训培养出来的。10天前也许是一位体育老师,10天后就可能变成一位普通话水平测试员,他们自身说的普通话标准度通常比较高,但他们缺少对语音的深刻的理性认识,他们无法通过瞬时听辨,真正掌控语音错误和语音缺陷的界限。由于语音具有模糊特性,即便理论上掌控了语音错误和语音缺陷的界限,实际听辨时,也很少有人敢说自己判定的语音错误就是语音错误、语音缺陷就是语音缺陷。或许正是由于这样的实际情况,为保证PSC的测试信度,才有了“人测”字词改成“机测”字词的变化。

        尽管字词由“人测”改成了“机测”,但说话仍采用人工测评。这是因为语音的模糊性在说话测评时较字词测评时表现得更突出、更充分,若说话也采用“机测”,则无法保证测评信度。由此可看出说话的精确评分系统设置可能与语音的客观模糊性存在矛盾。

        我们将字词测试和说话测试比较一下:读字词,应试人3分钟读100字,说话,应试人3分钟说600字,说得快的可达到或超过1000字。一对比我们发现:测评3分钟的100字,测试员又听音又看字,尚不能做到语音错误和语音缺陷的精确判定,测评3分钟的600字,测试员只能听音没有字看,却要求做到语音错误和语音缺陷的精确判定,这怎么可能?这只能是强人所难罢了!

        诚然,《大纲》对说话的语音错误数量设置具有一定弹性。比如,一档语音的错误“极少”;二档、三档语音的错误“在10次以下”;四档语音的错误“在10到15次之间”;五档语音的错误“超过15次”;六档语音的错误“多”。然而这样的弹性表述会带来两个相互矛盾的问题,一是“极少”和“10次以下”出现交叉,如“1-2”既表“极少”又表“10次以下”。二是档内有弹性,而档间却很死板,比如错9次是二档或三档,错10次则为四档。举例说,应试人甲的方音较明显,语音错误出现9次,其语音标准度归入三档;应试人乙的方音也较明显,但语音错误出现10次,其语音标准度则归入四档。不经意多出一次语音错误,三档水平就要降为四档,或侥幸少了一次语音错误,四档水平就可升为三档。相邻两档次之间的分差最少是1分,即“说话”中一次语音错误,其价值为1分,它与“字词”中一次语音错误为0.1分或0.2分相比,没有必然道理。更何况在快速语流中听辨某一音节是错误还是缺陷,客观上存在难度。测试员一心二用,即使付出再多,也无法保证计算的精确性,在快速语流行进中,应试人出现9次语音错误,很可能被计成10次,应试人出现10次语音错误,也很可能被计成9次。

        江苏的说话评分试行办法,在语音错误的量的精确设置上,比《大纲》走得更远了一些,越加强调了语音错误数量的精确性,比如出现了“语音错误1次、2次、3次、4次、5-7次、8次、9次”这样的规定。其实这种钢性规定很难真正付诸于测评实践。

        测评实践出现问题,应该反思命题说话的语音测评设置是否存在问题。笔者认为现行设置既要求测试员一个一个去计算语音错误,又同时要求测试员去感知语音缺陷(方音程度)。这样的设置,一是测试员不堪胜任,二是有悖PSC题项的设计逻辑。笔者认为可考虑取消命题说话的“语音错误”评分项设置,将语音错误看作是语音缺陷的极致。

        测试员不堪胜任的问题前面已有所阐述,接下来我们来看PSC的题项设计逻辑。PSC一共有四个测试题项,第一项是“读单音节字词”,第二项是“读多音节词语”,第三项是“朗读短文”,第四项是“命题说话”。透过“单字、词语、作品、说话”四个测项可以发现:PSC题项的设置逻辑是:语音上由点到面、时间上由慢到快、内容上由无用到实用、测评上由精确到模糊。“说话”属于实用性测试,测评时理应采用模糊的测评设置。

        测评语音标准度,测试员往往瞬间要涉及到语音的音高、音强、音长、音质等要素,而在快速语流中语音错误和语音缺陷的界域,未必是非常清晰的,即便理论上可以画出清晰的界域,而实际测评起来测试员的感知仍然是模糊的。语音的本质特点就是具有模糊性,快速的说话语流,更是模糊得难以捉摸。从全局看,命题说话的语音标准度水平,应该显现在说话全过程里,即“面”上有无方音及方音程度如何,而与局部“点”上的语音错误出现多少没有本质联系。应试人语音错误出现多少,可以看作是文化水平高低的表征。比如:应试人说话中,出现很多含zh、ch、sh的翘舌音音节,其发音舌翘度不足,这说明应试人受方音无翘舌音影响,其说话难以标准,说通俗点就是应试人说话夹带方音。这样的方音听感性质遍及说话全过程,应试人说话的语音标准度水平因此会受到实质性影响,即便别人帮助他,他也不可能在短时间内改变这种状况。另一种情况,应试人如果在说话过程中将“拟稿”的“拟”错发成yǐ(正确音为nǐ)音,即便三分钟语流中反复n次,也无法从根本上证明应试人说话的语音标准度水平低。实际上,应试人会发nǐ音,若让其读“你”,他会轻松发出标准

    [1] [2] 下一页

  • 下一篇文章: 没有了