市场调查过程中需要对数据质量

发布时间:2016-11-27 来源: 调查 点击:

篇一:问卷数据质量的控制

问卷数据质量的控制

数据质量的好坏直接关系着提供调查结论的合理性,这将影响决策者判断市场问题的思路。因此,数据的准确、及时、有效、完整是问卷数据质量控制的依据和标准。

市场调研活动是个系统的工作过程。调查活动的实施情况与调查方案是否一致,或者实施调查中是否根据情势做了相应调整,都会对调查资料的质量带来一定的影响,这里我们不在探讨文案研究等其他调查方法所搜集资料的质量问题,仅以问卷调查数据的质量控制为题目,了解如何控制数据质量的问题。

数据完整性是成功市场调研的基础。而完成这个任务往往是调查督导的工作。 我们这里的假定是问卷的信度和效度都经受了检验的基础上而进行的讨论。 在这个阶段,我们需要把握的有这样五个阶段

一、审核

二、编码

三、录入

四、数据库整理

五、保存数据库

一、审核

审核工作是为了提高问卷数据的准确性和精确性而对数据收集表格进行的再检查,目的是筛选出问卷中看不清楚、不完整、不一致或模棱两可的答案。它主要表现为两个阶段。即现场审核和事后审核。

(一)现场审核

现场审核是调查者或督导在调查现场对收集到的所有数据进行检查。通过现场审核,可以实现两个目的,一是确保调查员按照适当的程序选择受访者,其次是采访并记录他们的反应,在出现大问题之前纠正错误。在这个阶段,最主要的是要把握时间。一旦受访者离开调查现场,则该活动就失去了依据。

因此,在这个阶段,无论是调查员还是调查督导,都应该在调研期间,不断总结经验,提高访谈的技巧和记录答案的效率。

(二)事后审核

也称为最终审核或办公室审核,是审核调查问题回答的一致性和准确性,作出必要的更正,并决定是否应该抛弃部分或全部数据。一般情况下,对自填式留置问卷、邮寄问卷要进行事后审核,对面访问卷,往往也需要事后审核,以保持问题回答的一致性和准确性。

举例:

1、被访者18岁,但他是两个孩子的父亲。 解析:出现不一致的可能行很大

2、在一份调查问卷中,受访者对所有问题的回答都是“非常满意”。解析:回答者无心回答或者心不在焉,抑或为社会合意性的影响,可视为废卷。关于这一点,曾反复强调,调查活动一定要与社会文化结构的变化结合起来,一定要根据环境来判断运用何种调查方法。

3、“在过去一个月里,您之处最大的项目是什么?”三位被访者给出如下回答:

购买新车;

去韩国度假”

水、天然气和电在我的家庭开支中比例最大

解析:要根据不同的情形来判断,也就是在审核时要分为必需品和奢侈品的分类。也可以视为在问卷设计过程中没有一个关于开放式问题回答的说明,问题存在于设计阶段,但该问题可以在调查阶段加以解释以弥补该问题的不足。

小资料:审核能够发现的问题

编辑能够帮助发现的问题

1、不恰当的调查程序

? 使用了错误的调查问卷

? 访谈不充分

2、不完整的访问

? 未回答问题

? 没有遵循正确的访问顺序

? 调查问卷部分没有填写

3、不恰当的访谈

? 受访者选择不恰当

? 访问者或被访者曲解了问题

? 偏见

? 答案不全

? 访谈者不能理解问题的真正意图

? 访谈者记录模糊

? 录音采访资料,泄露本应受到保护的受访者资料

? 访问者需要进行必要的训练和说明(如没有写下调查结果、错误的缩写等)

4、调查问卷中或调查过程中的技术问题

? 必要的问题没有留下足够的空间填写信息

? 在调查过程中被访者对某些问题出乎意料频繁给予极端回答,表明应该重新定义这些问题。

? 访谈者在调查中出现不恰当或不可行的行为

? 问题顺序的混乱会导致被访者回答是的不满和偏见

5、被访者对问题的态度

? 频繁拒绝回答某些问题

? 由于一些敏感问题(或存在敌意)导致调查中止

? 有证据显示调查者和被调查者在进行“您需要什么答案我们给你什么答案”

? 调查现场的其他人也会带来哦一些问题

6、应当解决的一致性冲突问题

? 矛盾的答案

? 错误的分类

? 不可能的答案

? 不合理的回答

提示:

预防错误:

一些潜在的编辑错误可以在现场编辑之前通过细心的计划加以预

防。

防止模棱两可的答案,不适当的被访者比错误发生之后再去纠正要

好得多。

二.编码

为了充分利用问卷中的调查数据,提高问卷的录入效率及分析效果,需要对问卷中的数据进行科学的编码。编码就是为每个问题的每种可能的答案分配一个代码。通常表示为一个数字。也可以说,编码是给出一个电脑能够识别的数字代码的过程,在同一道题目中,每个编码仅代表一个观点,然后将其以数字形式输入计算机,将不能直接统计计算的文字转变成可直接计算的数字,将大量文字信息压缩成一份数据集,使信息更为清晰和直观,以便对数据进行分组和后期分析。因此,问卷编码工作成为问卷调查中不可缺少的流程,也成为数据整理汇总阶段重要而基本的环节。从这个活动过程看,编码主要应用在描述性、结论性调研问卷当中,而对探索性调研的大量文字资料则因为分类的难度,一般不进行编码。

(一)封闭式问题的编码方法

事实上在调查问卷开始设计的时候,编码工作就已经开始了。因为有些问题的答案范围研究者事先是知道的,如性别,职称等。这样的问题,在问卷中以封闭问题的形式出现,被访者回答问题时只要选择相应的现成答案就可以了。

封闭式问题的调查问卷,在问卷回收审核后,就可以直接录入计算机,这对调查来说是非常便捷有效的。因此,在调查问卷阶强调用结构化、标准化的问题,就是为了方便这个阶段的工作。即便是那些事先不容易知道答案的问题,如购买某商品的地点类型、使用某种商品的主要原因等也可采用此类形式,但通常会在封闭式问题的答案中增加一个“其它”选项,就是为了保证所有的被访者在回答问题时都有合适的被选对象,并且这个选项被选择的机会应当是可以预见到很少的,不会超过主要答案被选择的机会。对这个“其他”项,只要分类有限,我们要根据它的出现频率来把握是否需要进一步分类编码,如果数值很小(低于5%),可以不再进行后编码。

(二)开放式问题的编码方法

对于开放性问题,被访者需要用文字来叙述自己的回答。问卷回收后这些答案不能马上录入电脑,需要后期的人员对其进行“再编码”。“再编码”是为了方便数据处理,对原编码的有效补充,有时还是对原编码的调整修改。“再编码”往往伴随着重新归类分组,由于电脑对数字型数据的偏爱,以及某些统计分析程序只能处理数字型数据,因此经过再编码,数据处理更方便,更可行。

对于问卷调查来说,开放性问题要保持较少的个数,因此,从功能上看,开放性问题多是对封闭式问题的补充或解释。

对回收问卷的再编码主要是针对开放式问题的。开放性问题的编码工作需要进行4个步骤才能进行数据的录入:

步骤1:录入答案。由于录入技术的进步,传统上对着问卷逐条寻找不同答案列出清单做法已不适用,多采用全部录入答案,然后再按照下列步骤实施编码。步骤2:尝试用不同方法对录入的答案进行排序、归类(许多软件例如excel、foxpro、spss甚至word的汉字版等都有按笔画和拼音排序的功能),并结合主

观判断,然后合并意思相近的答案。并且对明显相同的答案统计其出现的次数。例如:

形成类别数量适当的“编码表”。以上题为例,归纳的结果如下表:

编码表

填写的同类答案的总结。

步骤4:调查人员根据“编码表”中的编码对所有开放题的答案进行逐一归类,并在每个问题旁边写上实际答案在编码表中对应的号码。如下所示:Q4.请问您不喜欢吃巧克力的原因有哪些?(需要追问)

统计。

由此,可以总结出,编码的一般步骤是:

1.对每个问题的每个答案进行有意义的分类

2.建立相互排斥和完全穷尽的编码类别

3.建立一个适合于计算机分析的数据集 小资料:

编码需要注意的问题:

1、使用统一编码表和对编码表进行测试。无论是开放题还是半开放题,几道问题选项或答案内容相同、相近、类似等情况下,将这几道题目采用统一的编码表。这样做一是易于控制编码,二是给后期的数据处理、分析带来很多方便。另外,对于确定的编码表,在正式开展调查前应在小范围内对编码表进行测试(测试问卷50份左右),以便对编码表进行修正,并使编码人员充分理解编码表。

2、编码的合理性。首先编码应充分反映调查项目之间的内在逻辑联系,如对地区的编码,象对本省地市的编码值应该接近,以反映本省地理位置接近这一客观事实,并且在处理和汇总时容易设定条件。其次,还要遵循以下数字的用法:能用自然数,绝不用小数;能用正数绝不用负数;能用绝对值小的整数绝不用绝对值大的整数。

3、编码的广泛性和概括性。它包含两方面含义,(1)每个答案都可以在最终的编码表上找到合适的对应,否则编码表是不完备的。(2)最终的编码表应当全面的含盖问题设计时所要收集的各个方面的信息,有时候出现频次少但观点特别的回答可能代表一个特定的重要群体,从研究的角度来说包含这类编码也是非常重要。在确定最终编码表的时候,可以通过经验判断编码表是否包含了各个角度的回答。

4、编码的唯一性和排斥性。不同编码值不能表示相同的内容或有从叠交叉。每个答案只能有唯一的编码条目与之对应,不应出现同一个答案对应两个或以上编码条目的情况,否则编码表就不满足唯一性。例如:如果编码表中出现5-高兴、8-愉快,那么对于“快乐”这个答案就可以编成5也可以编成8。这种情况需要对编码表重新进行归纳。

5、严格界定回答问题的角度:对于同一个问题,不同的人可能从不同的方面或角度考虑,每一个方面又会有多种有关的观点和事实。例如:对于“您现在的职业?”这个问题,有可能得到就业状态的回答如:全职、兼职、失业、待业等;有可能得到所属行业的回答如:农业、制造业、商业、金融业、教育、艺术等;还有可能得到职称的回答如:农民、工人、商人、会计师、律师、教师等。如果这些答案都出现在同一道问题中,会给编码工作造成麻烦。比如统计部门的统计师,既可以编为统计师的代码,也可以编为统计部门的代码,同时它也符合全职的含义,在这种情况下编码工作就不能保证唯一性的要求。此类问题是编码人员无法解决的,要避免这种情况的出现应尽量在正式问卷确定之前根据调查目的调整提问的方式。如果调查目的需要了解一个问题多个方面属性的话,可以将一个问题分为多个问题,每个问题要求从一个方面进行回答。

6、详略应当适当:在归纳确认最终编码表的时候,经常会遇到将一些答案归纳在一起还是将它们分开的情况。对于这样的问题要根据研究目的和数据分析上的要求确定取舍。如果问卷的问题是询问事实的,如“您使用什么牌子的洗发水?”,设计人员可能会按研究的要求保留出现频次最高的前20个品牌,而将其余归纳为“其他品牌”。如果问卷的问题询问的是观点、意见,如“您为什么喜欢某牌子的洗发水?”,对较分散的答案则不能简单的从频次确定取舍。对于研究目的来说,即便只有很少的回答者因为“味道”而喜欢一个品牌,也可能是很重要的回答;而过于细致的分类又可能造成分析的不便。所以对这类问题,编码工作是

篇二:市场调查中常用的数据分析方法和手段

第四编 市场调查中的数据分析

第十五章 市场调查数据的录入与整理

第一节 调查问卷的回收与编辑

数据资料的处理过程是从回收第一份问卷开

始的。按照事先调查方案的计划,尽量确保每份问

卷都是有效问卷(所谓“有效”问卷,指的是在调查

过程中按照正确的方式执行完成的问卷)。问卷回

收以后,督导员必须按照调查的要求,仔细的检查

问卷。检查问卷的目的在于将有错误填写,或者是挑出不完整或不规范的问卷,保证数据的准确性。所谓错误填写即出现了那些不合逻辑或根本不可能的结果,通过对调查员的复核,可以检查出哪些调查员没有按照调查的要求去访问,那么,该调查员完成的问卷可能存在很多问题。还有可能出现漏答了某些必须回答的问题,比如被访者的人口特征等基本情况,造成问卷回答不完整。

鉴于这些情况,不管是由于调查员造成的还是被访者的原因,通常有两种方式进行补救:对于出现漏答的问卷,通常要求调查员对受访者进行重访,以补充未答的问题;如果不便于重访或重访后的问卷还有问题,数目不是很多,可以当作缺失值计。如果数量非常大,这份问卷就只能当作废卷处理,并且按照被访对象的抽样条件,补作相关的样本。

问卷检查

问卷的检查一般是指对回收问卷的完整性和访问质量的检查,目的是要确定哪些问卷可以接受,哪些问卷要作废。检查的要点包括:

(1) 规定详细的检查规则,一份问卷哪些问题是必须填写完整的,哪些问题出现缺失时可以容忍等,使督导员明确检查问卷的每一项流程。

(2) 对于每份调查员交回来的问卷必须彻底地检查,以确认调查员或者被访者是否按照相关的要求完成了访问,并且完整的记录在问卷恰当的位置。

(3) 应该将问卷分成三种类型,一种是完成的问卷,一种是作废的问卷,第三种是有问题的问卷,但是通过追访还可以利用的问卷。

(4) 如果抽样中有配额的要求,那么应将完成的问卷中的配额指标进行统计分析,确定问卷是否完成配额的要求,以便及时的补充不足的样本。

(5) 通常有下面的情况的问卷是不能接受的:所回收的问卷明显不完整,缺了一页或者多页;问卷中有很多内容没有填答;问卷的模式说明调查员(被访者)没有理解或者遵循访问指南回答等;问卷的答案几乎没有什么变化,如在态度的选项上全部选择第x项的情况;问卷的被访者不符合抽样要求;问卷的回收日期超过了的访问的时限等。

问卷的校订

为了加强问卷的准确性,对那些初步接受的问卷还要进行进一步的检查和校订,在校订的过程中,通常会发现问卷中存在有字迹模糊、问题漏选的、前后回答不一致的、答案模棱两可的和跳答错误的问题。问卷的某些问题答案可能出现字迹模糊的情况,特别是碰上无结构的开放式的问题时,因为调查员记录的不好,答案不容易识别。如果发现这样的问题,必须对受访者进行追访,将积极不清楚的地方填写清楚。

对于漏选的问题处理方法也是一样,出现漏选的题目因为各种原因,无法进行补充访问事后,普通的问题,而且数目不大的情况,通常作为缺失值处理;如果涉及到是受访对象的个人特征的问题,通常只能作为废卷处理。

问卷中有些问题的答案会出现不容易理解的模棱两可的情况,或者是使用了不是通用的缩写方式或词语,或者在该单选一项的问题中,圈选了两项等,都必须通过追访进行补救。另外就是回答时可能出现跳答错误的情况,这可能是因为被访对象没有很好的理解问题。如果出现这种情况,首先要核实被访对象是否符合抽样调查的条件(跳答题目往往是筛选条件),如果符合,进行追问补充,如果不符合条件,问卷只能作废,重新补充样本。

问卷的回收、检查与校订可能是非常繁琐、且工作时间很长的工作,但是却是保证数据处理过程中较少误差的重要的步骤。 问卷的编码

编码是指对一个问题的不同答案进行分组和确定数字代码的过程。大多数问卷的大多数问题都是封闭式的,在调查之前就已经完成了编码的过程,即每一组问题的不同答案的数字编码已经确定。而开放式问题,因为不知道会得到什么答案,或者是希望得到比列出的封闭式的选项更详尽的答案,所以在调查结束后,必须对这些开放式的问题进行事后编码。开放题的事后编码的工作量很大,无法预知会出现多少个新的代码和答案,而且有些答案是非常类似的,必须决定是否合并成一类呢,还是分成不同的代码。具体地说明编码需要以下几个步骤:

(1) 每个需要编码的项目都必须有一份编码表,将问题和项目的代码详细的标注在编码表的顶端位置,由于事先不知道会有多少新的代码或答案出现,所以一定要预备足够的空间。

(2) 如果编码的工作由一个编码员完成,出现错误的可能性相对较小。但实际上,因为需要编码的问题可能很多,一个认识没有办法按时完成的,这就需要多个编码员。在这样的情况下,一定要注意多个编码员工作的协调。应该安排编码员在不同的时间,或者相同的时间相同的地点,使用同一个编码表。这样可以避免编码重复的情况。

(3) 研究人员应详细制定编码的守则,指导编码员如何识别答案,并且将其归类,以及如何分配编码等等,并同时对编码的过程进行监督和检查。编码员在编码的过程中可能有两种倾向:一种是事无巨细将出现的每一种答案够给与新的代码,结果代码的数量比预料的要多出很多;另一种情况是对答案的归类过于粗糙,可能丢弃了数据

中有意义的差异。对于这两种情况都必须通过守则的规定,尽量避免。碰到无法确认的分类的时候,通常的做法是付与一个新的代码,如果需要合并,可以在将来的数据处理过程中完成。

(4) 可以对“不知道”、“无所谓”、“不清楚”、“缺失”事先规定,但是一定要注意规定的编码与实现对该问题的最大编码的预计的数量一致。

(5) 编码的字迹必须清楚,如果可能的话,及时的进行计算机的录入管理。

见图15-1问卷的编码

篇三:问卷调查中数据质量的管控

问卷调查中数据质量的管控

问卷调查中数据的真实性是件令人头痛的事情!如何提高数据的准确性和真实性显得犹未重要!多数的调查从业人员都认为问卷调查中数据质量的控制是个问题,也是个困惑。本期spss交流论坛的讨论过程就围绕《问卷调查中数据质量的管控》这一主题深入展开。

一、问卷设计要领

问卷调查应用于各种行业,在此先以互联网为例。通常大的网络公司网站的改版,平台外观的变化之前都会进行一系列的准备工作,而这些工作都是由用户需求驱动的。在这之前你需要明白用户的原始需求是什么(是不是可能有新的需求)?然后确定合理的设计流程:需求调研---需求分析---产品设计---设计实现。需求调研方面,你需要了解你面对的核心用户是谁?他们的属性(年龄、收入之类)如何?有什么样的需求?满足这些需求能给我们带来什么?调研结果的实现有很多途径,下面先说说问卷设计的基础知识。

二、问卷选题设计步骤

1. 提出足够的测量选题,通常提供的选题是最终问卷选题数的2倍。

2. 预试以删除不佳的题目:通常可以通过专家评估,内部试测等方式排除。例如内部试测中某一选题填答者答案一致性很高(标准差接近0),代表本题在被访者之间没有区别能力,则可考虑删除此题。

3. 选取内部一致性的题目。

4. 建立正式调查问卷:删除不良的选题后,就可进行最后的排版。通常问卷前会有一段文字来说明问卷标题、研究内容与目的、调查单位、感谢词、填卷说明等等。

5. 若不满意,回到1重复以上内容直到满意为止。

三、问卷设计精要与评述-----问卷设计的14条

1.题目是否符合研究假设的需要。

2.题目不宜过长,应以精简、易于阅读为原则。

3.问卷设计的用字不能含糊要明确,用字要浅显易懂,不要超出答题者的理解能力。

4.问题不能超出填答者的知识或能力。

5.任何一个备选答案皆不能有多重意义或包含关系。

6.一个问题不能有两个以上的观念或事物。

7.问题尽量以封闭式而非开放式的方式来填答。

8.问题不应涉及社会禁忌与隐私。

9.题目应尽量保持客观中立的原则,将自己的主观意见加入问题中,而设计出引导性的语句,将会造成填卷的偏差。

10.避免引诱回答或暗示回答的问题:例如,您赞不赞成抽烟?正确的问法应该是,谈谈你对抽烟的看法?

11.通常将一般的、易于回答、熟悉的问题放在前面,以避免填答者一开始就拒答

12.使用反向题目(防止填答者的草率与恶意回答)

13.使用同质题目。

14.量表尽量少使用打分项目,多使用语气词。

关于14条的评述

1.关于第7题,封闭题与开放题的设计与调查的目的有关,封闭便于统一分析,但开放式便于收集建议。开放题需要编码量化,重新分类,分析起来比较麻烦,所以开放题应该少一些。此外,开放题太多容易让被访者反感。一般开放题多为定性研究,所以更适合深访和座谈会是使用。

2.关于第12条,当你发现实际的数据有假时,他就为我们提供了辨伪存真的有效法门,可以说一妙招!反向问题通常不易太多,而且正反题目之间,要有一定的同质性,这样便于发现数据中的李鬼。如果正反题目设计的合理,正反题目应该是负强相关,反之,则是李鬼作怪。

3.第13题的同质题目,是指一个问题在问卷中设置两种问法,对一个受访者问2次,只要这两个答案不一样,哈哈虚假数据!比如:年龄和身份证号一起问,小孩的年龄与小孩的年级一起问。这是一种检验数据真假的好方法!用之于无形之中,屡试不爽,相当管用。不过,这招不能让访问员或者是代理公司知道。此外,为了防止认真的人发现后会以为问卷设计者太不细心了,以为粗心犯错了,所以这道题的问法应该有所讲究。

4.对于第14条,主要是发现目前的调查问卷中,一遇到量表就是打分,或者通篇全是很不满意、比较不满意、基本满意、非常满意之类的。其实,这些对于被访者而言在理解上的差异是比较大的。如果是10分的量表,7分与8分的差异有那么明显吗?而且实际中也发现问题的分值比较集中,数据的差异比较小。当然,打分容易量化,得到的是定距数据,满意不满意之类的也很容量化。但是,我们把量化的标准授予被访者,这难免在数据间形成差异。比如,我的打分严格,认为8分就相当高了。他的评分比较松,经常性的会有10分出现。10分是什么?那是完美无缺!如果我们提供的是语气词,就可以避免这种不妥。比如,调查服务人员的服务态度。态度首先是个模糊的概念,先是态才是度,度就很难把握。不同的被访者有不同的理解,采用打分并不妥当,因为被访者的主管因素影响评价的客观性。如果我们采用语气词恶劣、冷淡/爱理不理、比较友好、十分热情/贴心暖人、完美无缺,这样即使不同的被访者也基本能够给出客观的评价。此外,由于语气词之间的差异,我们也便于量化,而且量化的标准能够统一,因为掌握在分析人员手中。

四、信度与效度分析

什么是信度和效度?信度就是指测量数据和结论的可靠性程度,也就是说测量工具能否稳定地测量到它要测量的事项的程度。效度就是正确性程度,即测量工具在多大程度上反映了我们想要测量的概念的真实含义,效度越高,即表示测量结果越能显示出所要测量的对象的真正特征。

信 度

关于信度的数学定义,林震岩在其《多变量分析》一书中定义如下:

假定测量所得的测量分数为x,真实分数为T,误差分数为E,三者的关系为x=T+E,即误差分数越小信度越高,而信度则为测量分数x与真实分数T的相关系数的平方。通俗地讲,信度是说问卷设计本身的优劣,通过实际的填写数据,来反映问卷设计的好还是不好。信度系数越大,表明测量的可信程度越大。在实际应用中,信度主要有以下几种类型:

1.重测信度

这种方法通常是重复同样的测量来检验信度信度系数可以用相关系数来表示。假如我们第一次测量时的观测值是X,第二次的观测值是Y,那么重测信度就等于X与Y的相关系数。但重复测量时,我们要注意两次测量的时间间隔要恰当。如果时间间隔太久,可能会发生一些变故,影响到被调查者的态度,那么前后的测量就会有很大的差异。

2.复本信度

复本是针对原本而言的,它使原本的复制品。对一项调查的问题,让被调查者接受问卷测量,并同时接受调查问卷的副本的调查,然后根据结果计算原本和复本的相关系数,就得到复本信度。

3.内部一致性信度

内部一致性信度,主要反映的是测验内部题目之间的关系,考察测验的各个题目是否测量了相同的内容或特质。内部一致性信度又分为分半信度和同质性信度。

1)分半信度系数是通过将测验分成两半,计算这两半测验之间的相关性而获得的信度系数。测验愈长,信度系数愈高。这种方法一般不适用于事实式问卷(如年龄与性别无法相比),常用于态度、意见式问卷的信度分析。

2)同质性信度是指测验内部的各题目在多大程度上考察了同一内容。同质性信度低时,即使各个测试题看起来似乎是测量同一特质,但测验实际上是异质的,即测验测量了不止一种特质。同质性分析与项目分析中的内部一致性分析相类似,常用Cronbach α信度(系数)来测量。

4. 评分者信度

这种方法在测量工具的标准化程度较低的情况下进行的,是指不同评分者对同样对象进行评定时的一致性。最简单的估计方法就是随机抽取若干份答卷,由两个独立的评分者打分,再求每份答卷两个评判分数的相关系数。这种相关系数的计算可以用积差相关方法,也可以采用斯皮尔曼等级相关方法。

关于信度评述

Cronbach信度系数α的取值范围到底是多大?对于α的取值范围很多数书上的表达都比较模糊。Cronbach α系数的值一般在0和1之间。如果X系数不超过0.6,一般认为内部一致信度不足。也有学者认为,在基础研究中Cronbach α系数至少应达到0.8才能接受,在探索研究中Cronbach α系数至少应达到0.7才能接受,而在实务研究中,Cronbach α系数只需达到0.6即可。那么,到底α的理论取值范围是多大呢?

我们先看α的计算公式:a=[K/(K-1)]×[1-(∑S2i)/(S2x)]。其中,K为量表中题项的总数,S2i为第i题得分的题内方差,S2x为全部题项总得分的方差。需要强调的是S2x是总得分的方差,而不是总方差。总得分只是把每一题的得分加总,而总方差却是基于方差分析时的方差分解。在方差分析是,总方差一定大于组内方差;但是总得分方差确有可能小于题内方差。经过我的计算,α值的理论区间应该是(-∞,1]。比如这两组数据:1、2、3、4、5与5,4,3,2,2。经计算两列数据的α值为-40。

但是,实际中α系数检测的是数据间的内部一致性。也就是说前提假设数据内应该是基本一致的,也就是正相关的,所以通常范围在[0,1]这间。α值则表示一致程度。如果是出现负值,则说明两列数据的不一致程度。但是,-α值又不能简单理解成内部不一致系数,因为α是专门为测量一致性而设置的,也就是说只在表达一致性上有意义,或者可以说成是只在α值大于0时才有意义。当两列数据的相关系数为负是,总得分方差S2x肯定小于题内方差∑S2i,所以会出现负值。只是相关系数用于测量两变量之间的,而α系数可用于测量多个变量。

效度

效度及测量的有效性程度,也就是说测量工具确能测出其所要测量特质的程度。效度是科学的测量工具所必须具备的最重要的条件。效度分为三种类型:内容效度、准则效度和结构效度。效度分析有多种方法,其测量结果反映效度的不同方面。常用于调查问卷效度分析的方法主要有以下几种。

1.内容效度

内容效度又称表面效度或逻辑效度,它是指所设计的题项能否代表所要测量的内容或主题。对内容效度常采用逻辑分析与统计分析相结合的方法进行评价。逻辑分析一般由研究者或专家评判所选题项是否“看上去”符合测量的目的和要求。统计分析主要采用单项与总和相关分析法获得评价结果,即计算每个题项得分与题项总分的相关系数,根据相关是否显著判断是否有效。若量表中有反意题项,应将其逆向处理后再计算总分。

2、准则效度分析

准则效度(Criterion Validity)。又称为效标效度或预测效度。准则效度是指量表所得到的数据和其他被选择的变量(准则变量)的值相比是否有意义。根据时间跨度的不同,准则效度可分为同时效度和预测效度。准则效度分析是根据已经得到确定的某种理论,选择一种指标或测量工具作为准则(效标),分析问卷题项与准则的联系,若二者相关显著,或者问卷题项对准则的不同取值、特性表现出显著差异,则为有效的题项。评价准则效度的方法是相关分析或差异显著性检验。在调查问卷的效度分析中,选择一个合适的准则往往十分困难,使这种方法的应用受到一定限制。

3、结构效度分析

结构效度又称为建构效度,是指测量结果体现出来的某种结构与测值之间的对应程度。结构效度分析所采用的方法是因子分析。最关心的问题是:量表实际测量的是哪些特征?在评价建构效度时,调研人员要试图解释“量表为什么有效”这一理论问题以及考虑从这一理论问题中能得出什么推论。

信度与效度的关系

1.信度低,效度不可能高。因为如果测量的数据不准确,也并不能有效地说明所研究的对象

2.信

市场调查过程中需要对数据质量

度高,效度未必高。例如,如果我们准确地测量出某人的经济收入,也未必能够说明他的消费水平。

3.效度低,信度很可能高。例如,即是一项研究未能说明社会流动的原因,但它很有可能很精确很可靠地调查各个时期各种类型的人的流动数量。

4.效度高,信度也必然高。

五、伪数据的识别与处理

调查数据由于访问员的素质层次不齐,或者被访者的配合程度不同,数据中难免会出现伪数据,或者说是造假数据。因为很多调查公司的访问员或者是实地执行的督导,为了完成任务或赚取更多的经济利益而有意伪造数据。

前面提到的同质问题、反向问题在一定程度上可以帮助分析人员查找伪数据,在此不再赘述。此外,还可以通过逻辑判断来查找数据的真伪,比如性别为男,却回答了男性本该跳过的题目。一般来说,通过分析每一份个案中同一选项的比例,可以发现伪数据。比如,某个个案中,在30题中c选项的比例超过阀值(比如80%)则可以视为伪数据。或者通过计算某个访问员所有调查问卷中选项的比例,如果某一项的比例超过阀值,则可以认定该访问员造假,则放弃该访问员的所有调查问卷数据。

这里我们重要探讨是否可以通过查看数据的分布,来判定调查问卷数据的可靠性。以满意度调查为例。在对数据量表量化之后,可以计算每个个案的所以量表的总分。比如,一共有30题,每题的得分范围为1-10分。那么总分的理论取值范围就是30-300。如果我们一共收集了500份问卷,那么就应该有500个总得分。现在我们据此总得分字段来分析问卷的真实程度。

理论上讲,一项服务的满意度也应该服从正态分布。因为大多是被访者的评价应该差不多,高分和低分的数量应该比较少。当然,这只是经验判断。那么现在我们来看,调查结果的总得分分布,如果接近正态分布,则可以说该调查数据是可信的。如果,数据远远偏离正态分布,则认为该数据存在比较严重的质量问题。这个时候可以考虑重新组织调查。

如果该批数据量比较大,而且实际情况又不能重新调查,可分析人员又必须确保数据分析结果的准确,则可以尝试在调查数据中进行抽样。抽样的要求则是抽样结果中总得分指标近似服从正态分布而且使得样本量最大。可能,目前还没有这样的抽样软件。不过,我们也可以通过手动处理,将偏态数据通过删减异常值或加权处理,使之接近正态分布。

相关热词搜索:市场调查 过程中 质量 数据 市场调查报告 学校食堂饭菜质量 对于lv的质量调查

热点文章阅读

版权所有 小龙文挡网 www.xltkwj.com