第三章 市场调研管理
一、市场调研的含义、特点及内容与分类
(一)含义与特点:指调研者对商品及服务市场相关问题的全部数据,有计划、有组织地进行系统收
集、记录、分析的过程。其具有以下五个特点:
1.系统性:包括设计、收集、计算分析等过程;
2.客观性:调研必须采用科学方法,对事实证据的阐述必须排除主观性;
3.时效性:反映的只是某一特定时期的信息和情况;
4.多样性:主要体现在多种调研形式和方法上;
5.不确定性:调研结果与实际情况之间可能会出现偏差。
(二)调研的内容与分类:
调研的内容是由调研的目的决定的。其内容包括市场环境、商品需求、商品资源、流通渠道调研等。在企业营销决策过程中所进行的市场调研具体包括:
1. 市场竞争调研:属于战略调研,也是竞争情报收集工作,为最高领导层战略决策提供依据。包括竞争环境(宏观与行业环境)、竞争对手或并购的目标企业的信息收集。
2.市场细分调研:也是战略调研。市场细分就是通过调研,根据消费者的需要和欲望、购买行为、
购买习惯等方面的差异,把某一产品市场整体划分为若干个具有类似需求倾向的消费群体的过程。也
就是按某种共性特征区分具有相似特征的顾客群,比如,可按照顾客年龄、收入、性别等划分。比
如,运动鞋市场可按购买者的年龄分为中老年、青少年和儿童运动鞋三个子市场;也可按顾客性别分
为男式鞋与女式鞋两个子市场。
市场细分的方法:可用地理、人口统计、消费者心理及行为等变量来细分消费者市场;用人口统
计变量、操作变量、购买途径、情境因素、个人特色等变量来细分工业品。
市场细分要有效必须具备四个条件:可衡量性、可接近性、足量性、可行动性。
3.产品定位调研:即市场定位,指在选定的目标市场上,根据自身的优劣势和竞争对手情况,为本
企业产品确定一个位置,树立一个鲜明形象。
市场定位的方法有七种:属性定位、利益定位、使用(应用)定位、使用人定位、竞争者定位、产
品类目定位、质量(价格)定位。
注意:市场细分、选择目标市场、市场定位三者间的关系。
(老、青、儿) (儿) (高档)
例:根据构成整体市场的不同消费者的需求特点、购买行为、购买习惯等,将整体市场划分为若干
个具有某种相似特征的消费者群体。这种作法被称为( )。
A. 消费市场分析
B. 目标市场选择
C. 市场细分
D. 市场定位
出现下列两种情况时须考虑重新定位:一是竞争者推出的市场定位在本企业产品的附近,使本企业品
牌的市场占有率有所下降;二是消费者偏好发生变化,从本企业品牌转移到竞争对手的某品牌。
4.产品调研:是以产品为中心,以消费者为对象,为企业制订营销计划而进行的市场调研。包括对
产品的概念、包装、价格和促销方式等属性进行测试,以了解其是否为目标消费群体所接受,并估测
目标群体所形成的细分市场规模。
5.广告调研:主要内容包括广告环境、广告主体、目标市场、市场竞争、广告媒体、广告效果、国
际广告调研等。
6.渠道调研:渠道是指产品从制造商到批发商再到零售商,最后到用户手中的整个过程。可分为流
通市场和零售市场调研两部分。调研主要分析指标包括渠道结构及作用力、各渠道的竞争态势、市场
渗透率、产品在各渠道的流通速度及利润率、用户的购买习惯及满意度等。该调研能帮助企业发现最
优的分销渠道以及选择最合适的渠道成员。
7.销售调研:作用有三:可获得销售方法和销售技术的有效性、划分销售区域、合适的薪酬方法和
销售激励要求等方面的信息。
8.用户满意度调研。用户满意度是指用户通过对一种产品的可感知的效果或结果与其期望值相比较
后,所形成的愉快或失望的感觉状态,它是评价企业质量管理体系业绩的重要手段。
市场调研的分类:见P77。
市场调研的程序
二、市场调研的程序
(一)确定调研性质
根据市场调研问题,市场调研可分为探索性、描述性和因果关系调研。
1.探索性调研:是在对研究对象缺乏了解的情况下,或在正式调研之前进行的小规模调查活动,通
常用来确定调研的问题。
2.描述性调研:在对研究对象有一定了解的情况下为进行更为深入的研究而进行的调研活动。一般
是有计划、有目的、有方向、有较详细提纲。
3.因果关系调研:主要是探索某种假设与条件因素之间的因果关系,解决为什么的问题。
例:有计划、有目的、有方向、有较详细提纲的调研属于( )。
(二)设计调研方案
包括:
1.确定调研目标,目标决定了调查的范围、内容和方法,因此是首要的一步。
2. 确定调查对象和调查单位。
3. 制订调查提纲和调查表。
4. 确定调查时间(调查资料所属的时间)和调查工作期限(工作的开始和结束时间,包括从方案设
计到提交调查报告的整个时间)。
5. 确定调查地点:当调查地点与单位不一致时,有必要规定地点,如人口普查。
6. 确定调查方式和方法。收集资料的方式有普查、重点调查、典型调查、抽样调查等。具体方法有
文案法、访问法、观察法和实验法等。
7. 确定调查资料整理和分析方法
8. 调研经费预算。
9. 确定提交报告的方式。主要包括报告书的形式和份数、报告书的基本内容、报告书图表量的大小等。
10. 制订调查的组织计划。即为确保调查实施的具体工作计划。
(三)实施调研和数据采集:关键是实施过程中要有严格的组织管理和质量控制,重点应做好三项工
作:一是挑选和培训调研员,二是进行调研工作的质量监控,三是查收和评价调研员的工作。
(四)数据的处理与分析:分析的目的是解释数据并提出结论。主要工作包括:查收和校对资料、编
码、录入建立原始数据库、数据查错和净化,处理缺失数据、数据处理制表制图和统计分析等。
(五)撰写调研报告
1.报告的形式有:书面报告和口头报告。
口头报告:需准备执行性摘要、书面报告的复印件及演示文稿。
2.书面报告的内容:标题页、目录、概述、正文、结论与建议、附件6部份。
注意了解各部份应写的主要内容。
例:调研的目的、对象和方法应在书面报告中的( )部份中。
A.目录
B.标题页
C.正文
D.概述__
三、二手数据——已收集、记录、整理好的各种数据和信息。
(一)种类:
按性质分:宏观市场信息、微观的环境信息、企业的直接环境信息;
按来源分:外部资料、内部资料;
按载体分:印刷资料、电子资料、口头信息。
(二)优缺点:
1.优点及应用:成本低、资料易获得、收集时间较短、有助于明确探索性调研中的研究主题、可提供收集原始资料的方法、可提醒市场研究人员应注意的潜在问题和困难、提供必要的背景信息甚至一些解决问题的方法。
二手数据的调研是市场调研的首选。经常采用该方法的情况是:市场供求趋势分析、市场占有率分析(包括全部、可达和相对市场占有率P80)、市场覆盖率(本企业产品投放地区数/全市场应销售地区数)分析、相关和回归分析。
例:用企业的销售额占全行业销售额的百分比来表示的指标是( )。
A.全部市场占有率
B.相对市场占有率
C.市场覆盖率
D.绝对市场占有率
2.缺点及评估:缺点有三:资料的相关性不够、准确性不够(如相关性描述数据需要适合度、准确性和可信度,若二手数据缺乏其一,将是无用信息)、收集二手数据的目的、性质和方法不一定适合特定的市场调研情况,所以有必要先评估二手数据。
(三)来源:
1.内部来源:业务资料、各种统计报表和分析报告、财务资料、生产技术资料、档案资料及其他资料。
2.外部来源:各级政府部分公布的有关资料、各种非政府组织提供的市场信息;各类经济信息、情报、咨询机构提供的市场信息、有关生产和经营企业的信息资料如产品说明书、广告说明书、价目表等;图书馆资料、媒体资料、互联网信息、及各种会展资料。
(四)二手数据收集程序和途径:P81。
原始资料的收集方法
四、原始资料的收集方法:注意掌握各种方法的操作方式、优缺点和关键点。
原始资料是通过实地调研获取的第一手资料,具有直观、具体、零碎等特点,一般采取邮寄调查、人员访问、电话调查、互联网访问和观察法。
(一)邮寄调查
优点有以下5项:
是原始资料调查中最便宜、最方便、代价最小的方法;
调查的空间范围广,没有访问人员偏差;
给予被调查者相对更宽裕的时间作答,可避免面访调查中可能受到的调查人员倾向性意见的影响;
匿名性较好,适于调查一些不愿公开讨论的敏感性问题;
适用于从那些难以面对面访问的人员那里获得信息。
缺点有4项:问卷回收率低、回收期长时效性差、缺乏对调查对象的控制、可能会出现错误的答复和不真实的信息。
使邮寄调查更有效的重点和难点是提高问卷回收率,具体方法有:请权威机构主办、随问卷附上回邮信封和邮票、附加一点实惠的礼物、加强问卷的跟踪管理。
(二)人员访问
例:街头拦截访问的时间适合控制于( )以内。
A.20分钟
B.40分钟
C.1小时
D.2小时
(三)电话调查:
1.传统电话调查:采用普通电话随机拨号(方法有二,见P83)进行调查。成功调查的关键在于:设计好简明易懂的调查问卷、对访问员进行电话调查技巧的培训、调查样本的抽取及访问时间的控制、访问员还需掌握一定的访问技巧(P83)。
2.计算机辅助电话调查CATI,其软硬件系统构成见P84。
电话调查优点:取得资料的速度最快、节省调查时间和经费、覆盖面广、被调查者不受调查者在场的心理压力,回答率高、对不易见到面的被调查者采用此法可能成功、采用CATI更有利于访问质量的监控、可达到管理集中、反馈及时之效。
缺点:调查内容深度不够;结果只能推论到有电话这一对象总体,不利于资料收集的全面性;没办法提供直观教具;很难判断所获信息的准确性和有效性。
(四)网上访问:分为网上问卷调查法、网上实验法和网上观察法,常用的是网上问卷调查法,这主要有以下三种基本方法:
1.E-mail问卷:制作方便,分发迅速,但只限于传输文本,图形与问卷文本是分开的。
2.交互式CATI系统:因特网服务器直接与数据库连接,对收集到的答案直接储存。
3.网络调研系统:无须使用程序,通过网站,使用者可随时在屏幕上对回答数据进行整体统计或图表统计。
网上访问优点:辐射范围广,访问速度快信息反馈及时,匿名性很好,费用低,网上访问的费用将是最低的。
缺点:样本对象局限于网民,所获信息的准确性和真实性程度难以判断,需要一定的网页制作水平。
(五)观察法:即通过观看、跟踪和记录调查对象言行来汇集资料
1.分类
2.步行动作路线观察:
即通过调查人步行轨迹,作为店铺配置和陈列、城市建设规划的人行道网络
的基础资料。一个店铺的销售额可通过下列公式计算:
销售额=顾客人数×顾客人均购买额
=步行路线的长度×路过率×视认率×购买率×购买频数×商品单价
可以看出,对于零售业,步行动作路线长度越长,销售额增长越大。所以合理安排通道和摆设,让顾客在店铺内多走动,多看,多买,销售额就会增加。
3.神秘购物观察调查:使接受过相关培训的个人以潜在消费者或真实消费者的身份对任意一种顾客服务过程进行体验与评价,然后通过某种方式详细客观地反馈其消费体验。有四种类型:P86。
采用这种方法时,应统一评估标准,并应让两个以上的观察人员来进行评估。
4.观察法的优缺点:
优点:直接性、情境性、及时性、纵贯性;
缺点:只能反映客观事实的发生过程而不能说明其原因;只能观察到一些表象和行为,不能反映私下行为;观察者在某种程度上往往会影响被观察者,难免带有主观性和片面性;常需要大量的观察人员,调查时间长、费用高。
问卷和抽样设计及数据分析
一、问卷设计:
(一)概念与类型:
概念:它是调研者根据调研目的和要求,设计出的由一系列问题、备选答案及说明组成的,向被调查者收集资料的一种工具。
分类:根据调研题目的类型分为:开放式(仅提供问题,答案由被调查者自由发挥)和封闭式问卷(常用,也称结构性问卷,提供问题和备选答案)。
根据调研方式分为:派员访问问卷、电话调查问卷、邮寄调查问卷、网上调查问卷和座谈会调查问卷。
根据问卷的填答方式分为:自填式和代填式问卷。
(二)问卷的结构
1.开头部分:包括问候语、调查说明和编号,具体内容见P87
2.正文部分:包括收集的资料(是问卷的主体,即各种问题和备选答案,也是问卷设计研究的重点)和基础数据(包括家庭的人口统计学上的特征以及被调查者的个人信息)
3.结尾:一般可加上1-2道开放式题目,然后对被调查者的合作表示感谢。最后还应附上一个“调查情况记录”(调查员姓名、编号;受访者姓名、地址、电话号码等;问卷编号;访问时间;其他如设计分组等)
(三)问卷设计的程序:
1.明确所要收集的信息:是设计的第一步,要联系调研主题得出本次调查的基本项目结构,然后决定调查样本总体和调查内容。
2.问题的内容:应反复检查问题的内容能否准确地反映所需要的信息
3.问题的措词:清晰简明、长度适当、避免意思含糊不清、避免诱导性或负面问题、避免否定式问题、避免对问题进行评估和概括、避免(暗含)假设性问题、答案选择不应重叠、避免双重问题。
4.回答问题的方式:以封闭式为主
5.问题的顺序:应从评估到诊断,然后进行归纳分类
6.问卷的布局:必须容易使用
7.问卷的预测试和修订:预测试后,任何需要改变的地方应当切实修改,改动较大的应进行第二次测试。
8.准备最后的问卷
二、抽样设计
(一)抽样调查概述
1.概念:从研究对象的总体中抽取一部分单位作为样本进行调查,据此推断有关总体的数字特征。“总体”是所要调查对象的全体组成的集合,必须具备大量性、同质性、变异性三个特征。组成总体的各研究对象称为“总体单位”。“样本”是总体的一部分,是由从总体中按一定程序抽选出来的那部分总体单位所组成的集合。
2.特点有5项:是非全面调查、样本按随机的原则抽取(代表性强)、以抽取的全部样本单位作为一个“代表团”代表总体、样本数量有保证、调查结果的准确程度较高。因此,抽样调查被认为是非全面调查方法中推算和代表总体最完善、最有科学根据的方法。
3.步骤:界定总体——制订抽样框——分割总体——决定样本规模——确定调查的信度和效度——决定抽样方式——实施调查并推测总体。
(二)概率抽样方法:让总体中的每个单位都有一个已知的、不为零的概率进入样本。有三个特点:概率抽样以随机原则为基础、必须通过一定的随机化程序来实现、抽样误差是可计算和可控制的。因此,可排除调查者的主观影响。
具体有以下五种方法:
1.简单随机抽样 ——最基本的抽样
也称纯随机抽样,对总体单位不进行任何分组排列,仅按随机原则直接从总体中抽取样本,使总体中的每一个单位均有同等的被抽取机会。理论上最容易处理,适用于总体规模不太大的情况。
2.等距抽样——广泛应用的抽样
也称为系统抽样或机械抽样。首先它将总体中各单位按一定顺序排列,根据样本容量的要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位。
排序(可按有关标志、无关标志及自然状态排,例如在购买力调查中,按收入多少由低至高排序,也可按户口册、姓氏笔划排。)——定间隔——随机定起点——等间隔抽样。
按照具体实施等距抽样的做法,等距抽样可分为:直线等距抽样、对称等距抽样和循环等距抽样三种。
等距抽样的主要优点是:第一,易于实施,工作量少。第二,样本在总体中的分布比较均匀,故而抽样误差小于或至多等于简单随机抽样,即较为精确;因此,等距抽样成为的一种抽样方法。
缺点:由于等距抽样是以总体单位的无规律排列为前提的,如果总体单位的排列出现规律的周期性时,就可能出现系统偏差。
3.分层抽样
所谓分层抽样,就是先将总体按照一种或几种特征分为几个子总体(类、群),每一个子总体称为一层,然后从每一层随机抽取样本,将子样本合在一起,即为总体的样本。即分类随机抽。按照各层之间的抽样比是否相同,分层抽样可分为等比例分层抽样与非等比例分层抽样两种。
分层抽样的主要优点有:(1)总体内部分层明显时,能够提高样本的代表性,从而提高推断总体的精确性;(2)适用于既要对总体参数进行推断,也要对各子总体(层)的参数进行推断的情形,例如一项全国性抽样调查,若以省为层那么调查以后既可进行全国性的统计,也可获得各省的统计数据;(3)灵活方便,便于组织实施。
局限性:调查者必须对总体情况有较多的了解,否则无法进行恰当分层。
4.整群抽样
整群抽样是先将总体中各单位归并成若干个互不交叉重复的群(或“集合”),然后以群为抽样单位,从总体中抽取若干个群体作为样本,而对中选群内的所有单位进行全面调查的抽样方式。例如,要调查北京市小学生近视眼比例有多大,就可把全市小学生按所在学校分,先对所有小学校进行抽样,对抽中的学校所包括的学生再进行全面调查。整群抽样特别适用于缺乏总体单位的抽样框。应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异大,群间差异小。
整群抽样的主要优点是易于取得抽样框,便于组织,可以节省人力、物力和财力。最大缺点是样本分布不均匀,样本的代表性差,抽样误差较大。
5.多阶段抽样
也称为多级抽样,是指在抽取样本时,分为两个或两个以上的阶段从总体抽取样本的一种抽样方式。其具体操作过程是:第一阶段,将总体分为若干个一级抽样单位从中抽选若干个一级抽样单位入样;第二阶段,将入样的每个一级单位分成若干个二级单位,从入样的每个一级单位中各抽选若干个二级抽样单位入样,依此类推,直到获得样本。接上例,第一阶段先抽学校,第二阶段从抽中的学校中抽取部分年级作为样本,第三阶段从被抽中的年级的所有班级中再抽取部分班级作为样本,第四阶段从抽中的班级中再抽取部分学生进行调查。
相对于分层抽样和整群抽样,多阶段抽样的优点在于适用于抽样调查的面特别广,相对地可以节省调查费用。其主要缺点是抽样时较为麻烦,而且由样本对总体进行估计比较复杂。
(三)非概率抽样方式
非概率抽样,又称为不等概率抽样或非随机抽样,是调研者根据自己的方便或主观判断抽取样本的方法。主要有偶遇抽样、主观抽样、滚雪球抽样、、定额抽样等类型。
1.偶遇抽样,也称就近抽样、方便抽样或自然抽样。它是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象。其优点是方便省力,其缺点是样本的代表性差,,有很大的偶然性。
2.主观抽样,也称目标式抽样、判断式抽样或立意抽样。它是调查者根据自己的主观分析,来选择和确定调查对象的方法;。主观抽样取得的样本.其代表性取决于研究者对总体的了解程度和判断能力。主观抽样的优点是,可以充分发挥研究人员的主观能动性,其缺点是,样本的代表性难以判断,不能推论。
3.滚雪球抽样。当我们无法了解总体情况时,可以从总体中的少数成员入手。对他们进行调查向他们询问还知道哪些符合条件的人,再去找那些人并询问他们知道的人,如同滚雪球一样。我们可以找到越来越多具有相同性质的群体成员。
4.定额抽样。定额抽样从对总体性质的了解开始,在某一总体中考虑具有某种属性的人数所占的比例,然后从具有这种属性的人群中收集数据,并按各类人在总体中的比例赋予它的适当的比重。这样收集数据,从理论上讲应当能够代表总体。这种方法存在的问题是:定额的比例必须精确,但由于最新的关于总体性质变化的信息并不容易得到,往往造成抽样中的偏差。
(四)抽样中的误差问题
进行抽样调查可产生两类误差,一类是抽样误差,另一类是非抽样误差。
1.抽样误差 :由抽样的随机性产生,属于随机误差
抽样误差是指主要指样本平均数与总体平均数之差、样本比率与总体比率之差。
抽样误差中通常运用最多的抽样平均误差,即指样本平均数或样本比率的标准差。在重复抽样条件下,
(1)样本平均数的抽样平均误差公式为
其中,s为总体标准差,n为样本个案数。
(2)样本比率的抽样平均误差公式为:
其中,P为总体比率,n为样本个案数
实际计算时,则以样本标准差代替总体标准差,以样本比率代替总体比率。
对于不重复抽样,在总体个案数很大时,而样本个案数相对很小的情况节下,一般都采用重复抽样的平均误差公式来代替。
虽然抽样误差不可避免,但可以减小,其措施有:(1)增加样本个案数;(2)适当选择抽样方式。例如,在同样条件下,不重复抽样比重复抽样的抽样误差小,又如在总体现象分类比较明显时,采用分层随机抽样比其他方法的抽样误差小。
由于总体真正的参数值未知,真正的抽样误差也未知,所以抽样误差的计算一般都以抽样平均误差来代表真正的抽样误差。
2.非抽样误差
非抽样误差是指除抽样误差之外,由其他原因引起的样本指标与总体指标之间的差异。导致非抽样误差的原因主要有:(1)抽样框误差,是指因不准确或不完整的抽样框而引发的误差;(2)无应答误差,主要表现为低的答复率、不具代表性的样本;(3)应答误差,给出的答复与实际不相符。
(五)样本容量的确定
样本容量又称“样本数”。它指一个样本的必要抽样单位数目。适当的样本单位数目是保证样本指标具有充分代表性的基本前提。在市场调研中,确定样本容量的方法主要有:
1.直觉。通常在非概率抽样中应用。
2.统计精度。概率抽样的样本容量是在计算的基础上确定的,主要取决于满足估计精确度的要求。样本量的基本公式为:n=Z2s2/d2
n为样本量,Z为置信区间,d为抽样误差范围,s为标准差,一般取0.5)。
3.成本限制。这种方法是根据分配给项目的经费来决定样本容量。
4.行业经验数值。在运用非概率抽样方法,如定额抽样时,利用行业经验数值是非常有效率的。
三、基础统计分析
(一)描述统计分析
在市场调研中,广泛应用描述统计分析方法。
1.集中趋势的测度
集中趋势是指一组数据向其中心值靠拢的倾向,测度集中趋势就是确定数据一般水平的代表值或中心值,常用三个指标:
(1)众数,是一组数据中出现次数最多的变量值。有些情况下数据分布可能表现为双众数,甚至多众数,也可能没有众数(比如均匀分布)。众数的基本思想,是用来反映一组数据若存在聚中趋势,则在数据的中心,变量值出现的频数较高,众数就是这一位置的代表值。众数的一个突出特点是它不受极端数值的影响。
(2)中位数,是一组数据排序后处于中间位置的变量值,是一组数据的中点,即高于和低于它的数据各占一半。如49,58,56,60,63,89,78,
(3)均值,是集中趋势的主要测度值,用于反映一组数值型数据的一般水平。主要包括算术平均数、调和平均数和几何平均数。
例:反映一组数据的一般水平应用( )指标。
A.众数
B.中位数
C.均值
D.方差
或一组数据中出现次数最多的变量值是( )。
2.离散程度的测度
数据的离散程度是数据分布的另一重要特征,它是指各变量值远离其中心值的程度,所以也叫离中趋势。
离中趋势经过综合与抽象后对数据一般水平的概括性描述,它对数据的代表性取决于数据的离散程度,离散程度小代表性就好,反之代表性就差。离中趋势的测度有三种方法:
(1) 极差,也称全距,是一组数据中最大值与最小值之差。这是描述数据离散程度的最简单的方法,表明数据的分布范围。
(2)平均差,也叫平均离差,是各变量值(Xi)与其均值(
)离差绝对值的平均数。公式见P93。反映了所有数据与均值的平均距离。平均差越小,说明数据离散程度越小。
(3)方差和标准差。方差是一组数据中各变量值与均值离差平方的平均数,方差的平方根叫标准差。方差与标准差是反映数值型数据离散程度最主要、最常用的方法。
公式见P93
根据总体数据和样本数据计算方差及标准差时,计算公式略有不同。统计上对估计量要求满足一些条件(一致性,无偏性、有效性),为满足无偏性,样本方差计算时;分母要用n-1,而不是n。
3.相关分析
所谓相关分析,是研究现象之间是否存在某种依存关系,变量之间的相关关系主要有线性相关和非线性相关、正相关和负相关等几种形式。对两个变量间线性相关程度的测量称为简单相关系数。样本相关系数r定义公式为:(94页)
r越近于±1,变量间相关程度越高,越接近于0,相关程度越低。
由于存在样本抽样的随机性,样本相关系数对总体相关系数的替代在多大程度上值得信赖,需要进行检验。|
r|<自由度为(n-2)的t统计量t(n-2)、显著性为α(10%;5%)的相关系数(查相关系数表),其相关性是显著的。
在实际中,比较常用的相关分析有二元定距变量的相关分析、二元定序变量的相关分析、偏相关分析和距离分析等。
(二)推论统计分析
推论统计利用样本资料对抽出样本的总体作出推论的方法。在市场调研中,,除了对样本数据的水平或特征进行描述之外,还经常需要根据样本的信息,对总体的分布以及分布的数字特征进行统计推断。
1.单个样本的参数估计
参数估计是根据样本统计量对总体未知参数进行某种估计推断。
(1)点估计。用样本对总体未知参数作一个数值点的估计,称为参数的点估计。有多种方法,如矩法、最大似然法、最小二乘法等。根据矩法,为满足估计无偏性的要求,就是用样本矩去估计总体矩,即。
(2)区间估计。区间估计是用一个区间估计总体未知参数。
①总体方差s2已知时,建立总体均值μ的置信区间的统计量是Z统计量(0,1),置信度(置信概率)为1-α时,总体均值μ的置信区间的为
Za/2 是一定信度下的临界值,称可靠性系数,信度越高,可靠性系数越大。
是区间估计时已知n和s,对应一定的信度的置信区间的径,也就是估计时的最大允许误差。
②总体方差未知时,可用样本标准差S代替s建立置信区间,但此时应该用服从自由度为n-1的t分布统计量此时总体均值μ在置信度为1-a下的置信区间为
例:当总体方差未知,置信度为1-a时,总体均值的置信区间为( )。
例:当总体方差已知时,建立总体均值μ的置信区间的统计量服从( )。
A.正态分布
B.t(n-1)分布
C.x2分布
D.t(n-2)分布
2.单个样本的假设检验
假设检验是先对总体参数的值提出一个假设,然后利用样本信息,去检验原先提出的假设是否成立。通常经过以下步骤:
(1)提出原假设和替换假设。统计假设检验是用统计方法对预先设的某—假设的成立与否进行检验判断。预先所设的这一假设称为原假设,用H0表示:与原假设相对的假设是替换(备择)假设,它是原假设经检验不成立被拒绝接受时,所应接受的与原假设相对立的情况,用H1表示。
(2)确定并计算检验统计量。是根据抽样分布的原理,总体呈正态分布,用样本均值检验总体均值,总体方差s2已知时,应用Z统计量,计算公式为:
总体方差未知时,应用t统计量,计算公式为:
在不同的情况下应该选用不同的统计量。
(3)规定显著性水平α(通常可取0.05或0.01),并确定接受域与拒绝域的临界值。在用检验统计量对原假进行检验时可能会出现一种错误,即原假设正确(为真)却被当作错误的加以拒绝(“弃真”)。犯这种“弃真”错误的概率用a表示,称为假设检验的显著性水平,也就是“接受H1(替换假设)”时所要承担的决策错误的风险。
(4)作出统计决策。根据检验统计量的值位于接受域或拒绝域,接受原假设或拒绝原假设。若拒绝原假设,则意味着接受替换假设。
一般来说,用样本均值估计总体均值,如果总体方差已知,用Z统计量检验;如果总体方差未知,用t统计量检验。
例:单个样本的假设检验中,犯“弃真”错误的概率一般为( )。
A.0.05
B.0.1
C.0.02
D.0.005
四、多元统计分析
(一)多元回归分析
指的是多个因变量对多个自变量的回归。其中最常用的是只限于一个因变量y(被解释变量)但有多个自变量x1,x2···xn(解释变量)的情况,也叫多重回归。模型见P96
为了方便地进行模型的参数估计,对回归方程要做如下一些基本假定:(1)自变量与因变量之间存在线性关系;(2)随机误差项具有0均值和等方差;
(3)E(e)=0;(4)无自相关;(5)残差与自变量之间相互独立;(6)无共线性。
在计算过程中应注意的问题是:(1)样本量不得少于30条记录;(2)自变量与因变都应该是连续性数字型变量;(3)分类/等级变量可以采取哑变量(通常取值为0或1)。
计算出结果之后,要进行检验。常用的检验方法有R(复相关系数)检验、F检验、t检验、DW检验等。
(二)方差分析
又称“变异数分析”或“F检验”,用于两个或两个以上样本均数差别的显著性检验。在市场调研中,方差分析适用于实验数据、调查数据和观察数据的分析,目的是找出对该事物有显著影响的因素及显著影响因素的最佳水平。
由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类:一类是随机的不可控因素,一类是研究中施加的对结果形成影响的可控因素。
在方差分析中,若涉及的因素只有一个,称为单因素方差分析;若涉及的因素为两个或两个以上,称为多因素方差分析。例如,某连锁店对其自主品牌商品的价格弹性的测量,见P97。
无论是单因素方差分析还是多因素方差分析,其步骤一般为:(1)明确因变量与自变量,建立原假设;(2)计算总方差、组间方差、组内方差,建立方差表;(3)显著性检验,即用F检验;(4)分析结果。对于给定的显著性水平a(通常取0.05或0.01),求得临界值Fa,。如果由样本观测值计算得到的F值大于Fa。则在a水平下拒绝原假设H。;否则,接受Ho。
(三)列联表分析
列联表是观测数据按两个或更多属性(定性变量)分类时所列出的频数表。
一般来说,如果总体中的个体可按两个属性A与B分类,
A有r个等级,B有c个等级,从总体中抽取大小为n的样本,设其中有nij个个体的属性属于等级Xi和Yj,nij称为频数,将r×c个nij排列为一个r行c列的二维列联表,简称,r×c表。例如,抽取1000人按性别和色觉两个属性分类可列出2×2列联表:
男女
正常442514
色盲386
若所考虑的属性多于两个,也可按类似的方式作出列联表,称为多维列联表。由于属性或定性变量的取值是离散的,因此多维列联表分析属于离散多元分析的范畴。列联表只是检验所考察的各属性变量之间是否相关,而非检验变量之间的因果关系。一般使用c2分布来进行独立性检验。
例:方差分析中显著性检验用( )检验。
A.F分布
B.DW
C.t 分布
D.c2
列联表分析中采用( )分布来进行独立性检验。
A.F
B.DW
C.t
D.c2
(四)聚类分析
聚类分析是细分市场的有效工具,同时也可用于研究消费者行为、寻找新的潜在市场、选择实验的市场,并作为多元分析的预处理。
聚类分析也称群分析或类分析,是对样品或变量根据相似性进行分类。对样品的分类被称为Q型聚类分析;对变量的分类被称为R型聚类分析。变量如何选择,取决于聚类的归类。变量的类型有三种尺度:
(1)间隔尺度,即变量用连续的量来表示,如果存在绝对零点,又称比例尺度;(2)有序尺度,即变量用有序的等级来表示有次序关系,但没有数量表示;(3)名义尺度,即变量用一些“类”来表示,这些类之间没有等级和数量关系,相似物体的集合称为类。聚类分析方法主要有系统聚类法、样品聚类法、动态聚类法、模糊聚类法、图论聚类法和聚类预报法等。
用一组复杂数据产生一个相当简单的类结构,必然要进行“类似度”度量。一般来说,R型聚类统计量(或度量)有夹角余弦、相似系数、同号率;Q型聚类统计量(或度量)有:绝对距离、欧氏距离、明考斯基距离、-切比雪夫距离、马氏距离、兰氏距离等。类的特征主要用类的均值、样本散布阵及样本协方差阵、类的直径等来刻画。
(五)判别分析
判别分析是根据表明事物特点的变量值和它们所属的类求出判别函数,根据判别函数对未知所属类别的事物进行分类的一种分析方法。与聚类分析不同,它需要已知一系列反映事物特性的数值变量及其变量值,根据这些值来对一个样品进行归类,看它来自哪个总体。判别分析可根据判别的组数,分为两组判别分析和多组判别分析;可根据判别函数的形式,分为线性判别和非线性判别;可根据判别时处理变量的方法不同,分为逐步判别、序贯判别等;还可根据判别标准的不同分为距离判别、Fisher判别、Bayes判别等。
在市场调研中,—般根据事先确定的因变量(例如产品的主要用户、普通用户或非用户、自有房屋或租赁、电视观众或非电视观众)找出相应处理的区别性特性。在判别分析中,因变量为类别数据,自变量通常为可度量数据。根据自变量的值将样本归类。
例:下列最适合用来进行促销策略目标选定的是( )。
A.结合分析
B.判别分析
C.因子分析
D.聚类分析
因子分析
(六)因子分析
基本思想是,根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,不同组的变量间相关性较低,每组变量代表一个基本结构,并用一个不可观测的综合变量表示,这个基本结构称之为“公共因子”。英国统计学家Moser
Scott在1961年对英国157个城镇发展水平进行调查时,原始测量的变量有57个,通过因子分析发现,只需要用5个新的综合变量就可以解释95%的原有信息。因子分析的基本步骤是:(1)确定研究变量;(2)计算所有变量的相关矩阵;(3)构造因子变量;(4)因子旋转;(5)计算因子得分。
因子分析在市场调研中有着广泛的应用.,主要包括;消费者使用习惯和态度研究(U&A);品牌形象和特性研究;服务质量调查;个性测试;形象调查;市场划分识别;顾客、产品及行为分类。同时,还可根据因子得分确定不同重要程度的指标,管理者则可根据这些指标的重要性来决定首先解决的市场问题或者产品问题。
(七)结合分析
也称交互分析,在欧美国家的市场调研中被广泛应用。结合分析的基本假设是,产品或研究对象是由一系列的属性所构成的,例如,电脑产品的属性为品牌、显示器、CPU、内存、硬盘等,而各属性又有一定的水平,如显示器有14英寸、15英寸、17英寸等,CPU可能有奔腾5、赛扬、K6等。消费者的购买抉择过程是基于对这些属性的权衡与考虑做出的理性选择,因而,结合分析一般步骤为:(1)确定产品或服务的属性与属性水平;(2)将产品的所有属性与属性水平通盘考虑,并采用正交设计的方法将这些属性与属性水平进行组合,生成一系列虚拟产品;(3)请消费者对虚拟产品进行评价,通过打分、排序等方法调查消费者对虚拟产品的喜好、购买的可能性等;(4)计算属性的效用、计算属性的模型和方法主要包括最小二乘法回归、多元方差分析;(5)解释结果;(6)评估信度和效度,常用的有拟合优度和t检验等;(7)市场预测与市场模拟。
在市场调研中,结合分析可用于如下几个方面:(1)决定各种属性在消费者选择品牌(产品)时的相对重要性,(2)估计不同属性水平的市场占有率;(3)确定最受欢迎品牌的属性水平组合;(4)根据消费者对属性水平喜好的相似性,进行消费者市场分类,(5)应用于新产品概念识别,(6)竞争分析,(7)定价研究;(8)广告研究;(9)销售分布等。