引言:开展统计分析的方法有很多,具体使用哪些方法,是根据统计分析的任务与内容而定的。作为统计人员个人来说,并不是所有的方法都用过,都会用。在统计部门,总的来说传统的统计分析方法用得比较多,而基于数理统计学与计算机软件技术基础上的现代统计方法相对用的比较少;除那些参加全国统计建模大赛的年轻人或者要在核心刊物发表论文者外。作者多次参加过江西财经大学举办的“华创杯”“正大杯”市场调查大赛论文评审,发现目前大学生已广泛运用统计建模等现代统计分析方法,有的还利用大数据进行统计分析。
统计分析工作包括两个阶段:一是对统计数据的分析,二是统计分析报告的写作。数据分析至关重要,直接关系到分析的结论及对策建议的内容。数据分析的方法有很多,具体要使用哪方法,则要根据统计分析的任务要求与分析研究问题的深度而定。本文拟介绍14种统计分析方法。
一、统计分析方法分类
统计分析方法的类型大致可以分为:传统统计分析方法和现代统计分析方法。
(一)传统统计分析法
在这里,首先试图对传统统计分析法中的“传统”的时间性做一个初步界定,是否可以将“传统”认定在西方数理统计学创立以前,或者是在计算机及数据处理软件出现以前的时期。那时的统计分析主要是手工计算,即使计算器、计算机出现后,也没有依赖复杂的计算机软件。
从传统统计分析法的定义上,是指通过传统的统计方法和计算工具对数据进行整理、分析和解释的方法。主要用于描述数据的基本特征、推断总体特征、研究变量之间的关系以及处理按时间顺序排列的数据等。
传统统计分析法是一种古老的方法,其运用最早可追溯到中国的古代社会。
西周时期的平均数分析法。平均数法最早出现在西周时期,冢宰(掌管王家财务及宫内事务的官员)以30年粮食收成的平均数作为定额,规定国家支出,执行“量入为出”的财政管理原则。
战国时期的平衡分析法和对比分析法。战国时期,魏国国相李悝(前455年—前395年)在进行农民家计调查时,创造性地应用平衡法——收入减去支出得到差额,对家庭的收支状况进行分析。唐朝初期,发展为三柱结算法;唐朝中期,发展为四柱结算法;到宋代,应用非常普遍。战国时期,韩非(约前280年—前233年)采用对比分析法,分析了人口变动对财货分配的影响。唐宋时期,对比分析法广泛应用于户籍、土地、赋役等数据的比较分析。
宋代的中位数分析法。中位数分析法出现在宋代,主要用于财政支出和粮价平抑等方面。王尧臣(1003年—1058年)等人通过比较宋仁宗景祐年间的国家财政收支数额,确定每年的支出标准;沈括在东南地区推行“和籴”法,避免谷价波动。
分组分析法。分组方式的发展,早期有“结绳记事”,夏代出现复合分组,商代广泛应用于人口、军事、田猎、祭祀等方面。周代出现类型分组的雏形,春秋时期齐国国相管仲(?—前645年)提出“四民分业定居论”,将百姓按职业分为士、农、工、商四个社会阶层。西晋首创两端开口的年龄分组方法,宋代创立了分类法与次数分布表。
图表分析法。虽然具体的图表形式未见详细记载,但可以推测古代统计工作中可能使用了图表来直观展示数据和分析结果。
中国古代创造的统计分析方法中有的现在仍在使用。后来随着经济社会发展与计算技术进步,一些新的方法相继出现,如时间序列分析法、综合评价方法、因素分析法、结构分析法和相关分析法等。
(二)现代统计分析法
现代统计分析法,是指建立在概率论的数理统计学基础上的一种科学方法,通过利用数学和统计学原理,结合计算机软件技术,对信息进行全方位、深层次开发和处理的方法。这种方法在定量分析的基础上提出定性观点,以实现对研究对象的更深入理解和分析。现代统计学中常见的方法有:假设检验、聚类分析、ROC分析、多重响应分析、距离分析、对应分析、决策树分析、景气分析、神经网络分析和蒙特卡洛模型分析,等。随着新的统计软件技术的开发,数据挖掘风起云涌,特别是随着互联网海量大数据的产生,通过爬虫技术抓取大数据的大数据分析法,进一步开拓了现代统计分析的新领域。
与传统统计分析相比,现代统计分析法更加科学、精确,能够更有效地挖掘和利用数据集中的信息,为决策提供更可靠的依据。同时,要掌握和用好现代统计分析方法,则需要统计人员深入钻研与更多实践,具备相应的计算机、统计与经济知识。
二、常用的统计分析方法
实际统计工作中最常用的统计分析方法有:比较分析法、平均分析法、分组分析法、动态分析法、综合评价方法、因素分析法、结构分析法、相关分析法、平衡分析法、景气分析法、预测分析法、函数分析法、大数据分析法等,其中:比较分析法又是用得最多的一种,几乎所有的统计分析报告中都会用到比较分析法。以下是在统计分析工作中相对熟悉、使用得比较多的14种统计分析方法。
(一)比较分析法
比较分析法,是通过与某个标准值进行比较的一种分析方法。选择合适的比较标准十分关键。只有选择合适的比较标准,才能客观做出评价;否则,不仅不能正确反映研究对象的真实状况,反而还有可能得出错误的结论。在现实的统计分析中,比较标准主要有:时间标准、空间标准、规划(计划)标准和经验或理论标准,等。
时间标准
是选择不同时间的指标数值作为评价标准。如CPI中的“同比”与“环比”就是以时间作为标准来进行比较的。常见时间标准的情形:与上年同期对比,与上一时期对比,与历史最好(高)水平对比,与历史关键(特殊)年份对比。如:我国社会主义现代化建设的第一个阶段的目标是,到2035年基本实现现代化,人均GDP比2020年翻一番,2020年就是一个具有重要历史意义的年份和比较标准。
空间标准
是指选择不同空间的指标数值进行比较。如在进行一个地区的居民收入分析时,除了分析本地区的收入水平、来源(结构)和增速外,还会与全国和外省(市、县)进行比较,不同的地区就是空间标准。如:在分析一个国家或地区的总量和平均指标时,常常会与其他国家对比,与外(邻)省对比,与外(邻)市对比,与外(邻)县对比,通过比较发现本地区优势与不足。
规划(计划)标准
政府的规划标准:一个国家的中长期战略目标,如2035年我国基本实现现代化,人均GDP翻一番;政府部门提出的五年规划和年度发展目标。企业的计划标准:企业提出的年度经营计划数、定额数、达标数,等。在计划经济体制下,计划标准是统计分析中广泛应用的一项重要标准;市场经济也需要宏观调控,并不排斥科学合理的规划与计划,我国各级政府每年都会提出经济增长社会发展目标。统计的任务就是监测这些目标的实现进展。因此,规划(计划)标准对于统计评价而言仍然具有重要的意义。
经验或理论标准
是指通过对大量历史资料的归纳总结而得出的标准,统计分析时通过与这些标准比较,找出与标准的差距。前些年国家统计局出版的《领导干部统计知识问答》,列出了15个统计标准;长期以来作者常关注运用的一些标准有:
衡量居民生活水平的恩格尔系数标准。恩格尔系数在59%以上为贫困,50%~59%为温饱,40%~50%为小康,30%~40%为富裕,低于30%为最富裕。
衡量收入分配公平程度的基尼系数标准。基尼系数小于0.2时,居民之间收入过于平均;0.2~0.3之间时较为平均;0.3~0.4之间时比较合理;0.4~0.5时差距过大;大于0.5时差距悬殊。
人口老龄化的标准。当一个国家或地区60岁及以上的老年人口占人口总数的10%,或65岁以上老年人口占人口总数的7%时,即意味着这个国家或地区的人口处于老龄化社会。进一步划分的标准,轻度老龄化:60岁及以上人口占比在10%~14%之间;中度老龄化:60岁及以上人口占比在15%~29%之间;重度老龄化:60岁及以上人口占比超过30%。
通货膨胀程度标准。一般认为:通货膨胀率低于3%,属于低通货膨胀;通货膨胀率在3%~6%之间,属于温和通货膨胀;通货膨胀率在6%~10%之间,属于高通货膨胀;通货膨胀率超过10%,属于恶性通货膨胀。
世界不同收入类型国家划分标准。世界银行按一定的收入水平将世界各国(经济体)分为高收入组、中高收入组、中低收入组和低收入组,每年都有变化。2023年的划分标准是,低收入国家:人均GNI(国民总收入)低于1135美元;中等偏下收入国家:人均GNI在1136美元至4465美元之间;中等偏上收入国家:人均GNI在4466美元至13845美元之间:高收入国家:人均GNI高于13845美元。
(二)平均分析法
平均分析法,是利用平均指标(平均数)对社会经济现象进行分析的方法,反映社会经济现象在一定时间、地点条件下某一数量特征的一般水平。平均数分为算术平均数、几何平均数、调和平均数、加权平均数和中位数位置平均数等。平均分析法具有基础性分析作用,可结合其他指标综合运用。
具有基础性的统计分析作用
平均分析法在统计分析方法中是一个相对基础性的方法,应用极其普遍。平均指标直观、简明,具有高度概括的特点,很多统计分析都是建立在平均分析基础上的。可以用来比较同类现象之间的差距;可以对某一现象在不同时间上的总体水平进行比较,发现现象的发展趋势及规律;可以分析不同现象之间普遍的依存关系,发现影响现象发展的因素等。经济社会生活中有许多常见的平均指标,有的备受社会公众关注,如人均 GDP、人均可支配收入、人均生活消费支出和职工平均工资等。
结合其它指标开展综合分析
由于平均数是分析应用的基础指标,经常会与其他指标结合起来使用:
结合总量分析。在对不同个体进行总量指标分析时,平均指标与总量指标互相补充支撑,能全面客观说明问题。如:中美经济实力的对比,长期以来“中国GDP赶超美国”的话题普遍受到关注。在比较中美经济实力时, 应同时了解经济总量和人均水平。以2021年为例:总量上按美元计算的中国GDP占到了美国的75.5%,差距似乎越来越小了;但按人均则只有美国的17.7%,差距却相当大。因此,仅看总量或平均数,都可能会得出片面的结论。
结合差异分析。平均数反映了样本的平均水平,具有高度的概括性。但不足是掩盖了样本之间的差距,尤其易受极端值影响。在应用中要格外注意“被平均”的问题。在分析居民人均可支配收入、职工平均工资等指标时,要通过分组、图表、动态对比等多种方式,结合使用中位数、众数等多种指标, 来全面揭示平均数背后的丰富信息、数据变化和分布特点。
结合边际分析。平均数反映样本平均水平,边际量则反映自变量增加或者减少单位数量时因变量的变化情况。在分析一些具体问题尤其是做决策时,要按照需求选取平均分析或者边际分析。
(三)分组分析法
对比分析法,是针对总体进行的对比。由于组成总体的各部分具有多种特征,这就使得在同一总体范围内的各单位之间产生了许多差别,统计分析不仅要对总体数量特征和数量关系进行分析,还要深入总体的内部进行分组分析。
分组分析法,是把所研究的总体按照一个或者几个标志,划分为若干个部分加进行观察分析,以揭示其内在的联系和规律性。统计分组法的关键,在于正确选择分组指标和确定各组的界限。
如:年龄结构是一个国家或地区人口的重要特征,通常将一国(地区)的总人口划分为0—14岁、15—59岁、60岁及以上和65岁及以上4个年龄组,分析各个年龄组人口占比的变化趋势。2020年第七次全国人口普查,全国人口中0—14岁年龄组的人口占17.95%,同2010年比(下同),比重上升了1.35个百分点;15—59岁年龄组的人口占63.35%,比重下降了6.79个百分点;60岁及以上年龄组的人口占18.70%,比重上升了5.44个百分点;其中65岁及以上人口占13.50%,比重上升了4.63个百分点。通过两次人口普查数据对比分析可知,我国劳动力人口占比下降,预示未来将面临劳动力短缺问题;老龄人口占比明显增加,我国人口老龄化问题日趋严重。
(四)结构分析法
结构分析法是在统计分组的基础上,计算各组成部分所占比重,进而分析某一总体现象的内部结构特征、总体的性质、总体内部结构依时间推移而表现出的变化规律性的统计方法。
结构分析法是一种静态分析,是对经济系统中各组成部分及其对比关系变动规律的分析,主要计算结构指标,结构指标就是总体各个部分占总体的比重,因此各个部分的结构相对数之和等于100。计算公式为:结构指标(%)=(总体中某一部分数量/总体总量)?100%。图2反映的是2019—2023年我国三次产业结构变化的趋势。
图2 2019—2023年我国三次产业增加值占GDP的比重(%)
如果对不同时期内经济结构变动进行分析,则属动态分析。还可以揭示总体各个组成部分的变动趋势,研究总体结构变化过程,揭示现象总体由量变逐渐转化为质变的规律性。
(五)因素分析法
指数,是指反映社会经济现象变动情况的相对数。指数的作用:一是可以综合反映复杂的社会经济现象的总体数量变动的方向和程度;二是可以分析某种社会经济现象的总变动受各因素变动影响的程度,这就是因素分析法。
因素分析就是将研究对象分解为各个因素,把研究对象的总体看成是各因素变动共同的结果,通过对各个因素的分析,测定研究对象总变动中各因素的影响程度。
图1 2017—2022年“三驾马车”对我国经济增长的贡献率
因素分析法按研究对象统计指标的不同可分为:对总量指标变动的因素分析,对平均指标变动的因素分析。如:为了解和掌握经济增长中各因素的影响程度,计算产业贡献率、“三驾马车”的贡献率,计算公式:贡献率(%)=某因素增量/总增量?100%。图1反映的是2017—2022年“三驾马车”对我国经济增长的贡献率的变化情况。
(六)动态分析法
在统计分析中,如果一个指标只有孤立的一个时期数据,是无法作出任何判断的,既不知多少,也不知高低;既不知快慢,也不知好坏。如果通过编制时间序列(也称动态数列),就可以进行动态分析,反映其发展水平和速度的变化规律,为预测未来的发展趋势提供依据。
时间序列,是将同一指标在时间上变化和发展的一系列数值,按时间先后顺序排列形成的一组数据,它反映了社会经济现象的发展变动情况。时间序列的例子很多,如某个时期内按年度(季度)的GDP、消费、进出口的绝对数及增长率,按年(月)度的CPI和PPI的数据等,都属于时间序列数据。
开展动态分析,要求数列中每个数据的总体范围、指标计算方法、计算价格、时间间隔和计量单位都必须保持一致。许多综合指标是采用价值形态来反映实物总量,如国内生产总值、工业增加值、社会商品零售总额等,计算不同年份的发展速度时,必须消除价格因素。为观察我国经济发展的波动轨迹,可将各年GDP的发展速度编制时间序列,绘制成统计曲线图,给人更加直观的认识。
(七)平衡分析法
平衡分析是研究社会经济现象数量变化对等关系的一种方法。它把对立统一的双方按其构成要素一一排列起来,给人以整体的概念,以便于从全局来观察它们之间的平衡关系。
平衡关系广泛存在于经济生活中,大至全国宏观经济运行,小至个人经济收支。反映经济社会发展及其关系的平衡表有很多,如:财政平衡表、劳动力平衡表、能源平衡表、国际收支平衡表、投入产出平衡表,等。
平衡分析的作用:一是从数量对等关系上反映社会经济现象的平衡状况,分析各种比例关系相适应状况;二是揭示不平衡的因素和发展潜力;三是利用平衡关系可以从各项已知指标中推算未知的个别指标。
(八)综合评价法
在实际统计分析工作中,我们也会遇到这样的情形,评价一件事物用一个指标难以说清楚,而要从多个方面、用多个指标来评价,这个时候综合评价法就应需而生。综合评价方法,是指运用多个指标、通过对数据标准化、指标权重化、指标赋予目标值、计算单个指标分值、汇总求得综合分值的评价方法。
开展综合评价分为四个步骤:①首先是确定评价指标体系,指标体系要求具有全面性和系统性,这是综合评价的基础和依据。②搜集数据,并对不同计量单位的指标数值进行同度量处理,方法有相对化处理、函数化处理、标准化处理等。③确定权数,根据各指标所处地位和对总体影响程度,赋予指标不同的权数。④对指标进行汇总,计算综合分值,并据此作出综合评价。
综合评价法使用很广泛,如我们非常熟悉的反映工业经济效益的工业经济效益综合指数,反映全面建成小康社会的小康指数。2005—2020年作者负责江西全面小康进程统计监测,小康监测运用的就是综合评价法,对经济发展、民主法治、文化建设、人民生活和资源环境5个方面,用42个指标进程评价江西全面小康的进程。
(九)景气分析法
经济波动是客观存在的,是任何国家都难以完全避免的。如何避免大的经济波动,保持稳定发展,一直是各国政府在宏观调控和决策中面临的重要课题,景气分析正是适应这一要求而产生和发展的。
宏观经济景气分析。国家统计局在20世纪80年代后期开始着手建立监测指标体系和评价方法,经过十多年的不断完善,已形成制度,定期提供景气分析报告,对宏观经济运行状态起到晴雨表和报警器的作用,便于各级政府及时采取宏观调控措施。
企业景气调查分析。通过对全国各类大中型企业抽样问卷调查,由企业负责人回答有关情况判断和预期。内容分为两类:一是对宏观经济总体的判断和预期;二是对企业经营状况的判断和预期,如产品订单、原材料购进、价格、存货、就业、市场需求、固定资产投资等。
图3 2018年—2024年我国PMI运行情况
PMI调查与指数编制。PMI指数的英文全称为Purchasing Managers Index,中文意思是采购经理指数。是通过对企业采购经理的调查结果统计汇总、编制而成的月度综合性指数,涵盖了企业采购、生产、流通等各个环节,是国际上通行的宏观经济监测指标之一。企业景气调查和PMI都是反映企业经济活动的重要指标,前者侧重于季度调查,后者侧重于月度数据,两者共同构成了对企业经济活动的全面监测。
(十)相关分析法
相关分析法,是研究两个或多个随机变量之间线性依存关系紧密程度的方法。通常用相关系数来表示,多元相关时使用复相关系数。这种分析方法侧重于发现随机变量之间的种种相关特性,不像回归分析那样侧重于研究随机变量间的依赖关系,以便用一个变量去预测另一个变量。
开展相关分析的步骤是:收集准备数据、绘制散点图、选择相关系数、计算相关系数、解释结果。根据相关系数数值的大小判断变量之间的相关强度,一般认为:相关系数的绝对值大于0.8表示有高度相关,0.5到0.8表示有中度相关,0.3到0.5表示有低度相关,小于0.3表示关系极弱或无关系。
相关分析与回归分析的主要区别:相关分析研究的变量都是随机变量,不分自变量与因变量,主要目的是发现变量之间的相关特性。回归分析则侧重于研究某一随机变量(因变量)与一个或多个自变量之间的数量变动关系,并建立回归模型进行预测。在实际工作中,通常先进行相关分析,根据相关性的强弱决定是否需要进行回归分析;在相关分析的基础上建立回归模型,开展预测分析。
(十一)预测分析法
不论是宏观经济还是微观经济的决策,不仅需要了解经济运行中已经发生了的实际情况,更需要预见未来将要发生的情况。根据已知的过去和现在推测未来,就是预测分析。统计预测属于定量预测,是以统计数据分析为主,在预测中结合定性分析。
统计预测的方法大致可分为两类:一类是主要根据指标时间数列自身变化与时间的依存关系进行预测,属于时间序列分析;另一类是根据指标之间相互影响的因果关系进行预测,属于回归分析。
预测分析的方法有回归分析法、滑动平均法、指数平滑法、周期(季节)变化分析和随机变化分析等。比较复杂的预测分析需要建立计量经济模型,求解模型中的参数又有许多方法。作者曾经使用过最简单的线性回归模型做江西省粮食总产量预测,发现只适合特定时期内的中短期预测,长期预测则误差比较大。
(十二)函数分析法
开展统计分析时,要进行大量的数据计算。在OFFICE办公软件的EXCEL表中,有几十个统计函数计算模块。通过EXCEL表→公式→其他函数→统计函数的路径(见下图),可以找到需要的统计函数。这些函数能够帮助用户快速准确地完成各种小规模数据的计算。如:用GEOMEAM函数计算一个地区若干年度经济的平均增长率,用CORREL函数计算两个指标的相关性,都可于一瞬之间完成。
Excel表中用得比较多的统计函数有:
计数:COUNT函数用于统计数据的个数,COUNTA函数用于计算非空单元格的个数,COUNTIF函数用于计算区域中满足给定条件的单元格个数,COUNTIFS函数用于多条件计数。
求和:SUM函数用于求和,SUMIFS函数用于多条件求和。
求平均数:AVERAGE函数用于计算一组数据的平均值,AVERAGEIFS函数用于根据多个条件求平均值。
求最大最小值:MAX函数用于提取一组数中的最大值,MIN函数用于提取一组数中的最小值。
求标准差:STDEV函数用于计算一组数据的标准差的函数。
求相关系数:CORREL函数用于计算两个单元格区域之间的相关系数。
求几何平均数:GEOMEAM函数用于计算正数数组或区域的几何平均值,如计算一个时期平均发展速度和平均增长速度。
求指数增长值:GROWTH函数根据现有的数据,计算指数增长值。
求正态分布函数:NORM.DIST函数用于根据指定平均值和指定的标准偏差计算正态分布函数。
(十三)统计图分析法
统计制图也是一种常用的统计分析方法,统计图通过不同的几何图形和表现形式,帮助分析和理解数据,是统计分析中的重要工具。统计图是根据统计数字,用几何图形、事物形象和地图等绘制的各种图形,具有直观、形象、生动、具体等特点。统计图可以使抽象的统计数字简单化、通俗化、形象化,便于理解和比较。因此,统计图在统计资料整理与分析中占有重要地位,并得到广泛应用。
统计图的类型
在统计分析报告中常用的统计图有条形图、扇形图、折线图、饼图、散点图和词云图等,应根据统计分析要表达的主旨,选择合适的统计图。
条形图:用直条表示数量,易于比较数据差异。
扇形图:用扇形表示部分在总体中的百分比,显示部分与整体的关系。
折线图:用折线表示数据的变化趋势,反映事物的发展情况。
饼图:用于展示整体中各部分所占的比例,通过扇形的面积来表示各部分的大小。
散点图:用于展示两个变量之间的关系,通过点在坐标系中的位置来反映变量之间的相关性和趋势。
图4 消费者购买自动驾驶汽车意愿调查的大数据词云图
(来自2024年江西财经大学正大杯决赛论文)
词云图:是利用大数据分析的一种文本数据的可视化表达方式,通常由词汇组成类似云的图形,其核心价值在于通过高频关键词的可视化表达,来传达大量文本数据背后的有价值信息。
统计制图要点
统计是一门科学,也是一门艺术,而统计制图则赋予了更多的审美要求。
第一,根据数据特点和需要表达的意图,选择合适的图型。如:条形图适合比较不同类别的数据量,折线图适合展示数据随时间的变化趋势,饼图适合展示各部分的比例。第二,在制作统计图时,必须确保数据的准确性和完整性,避免误导读者。第三,统计图应有清晰的标题,简明扼要地反映图表的主要内容。图例做到清晰明了,便于读者理解图中的符号和颜色所代表的意义。第四,统计图应注明数据的计量单位和来源出处,以增加图的可信度和准确性。第五,力求做到统计图美观和可观性,图形布局结构匀称,刻度和比例适当。第六,通过添加线条或纹理效果来构建多样化的图样,颜色的选择确保统计图与背景色之间有足够的对比度。
(十四)大数据分析法
大数据分析法,是指对规模巨大的互联网数据进行收集、处理和解析,从中提取有价值信息的方法。大数据分析的核心在于通过深度挖掘数据的价值,帮助政府和企业做出明智的决策。
大数据分析的优势与好处有:一是高效的数据处理能力。能够快速分析来自不同来源的大量数据,帮助企业从广泛的角度获取信息,改善供应链、运营和其他战略决策领域的结果。二是精准受众与问题分析能力。通过理解客户需求、行为和情绪,提供更好的营销洞察,同时为产品开发提供信息。三是风险管理能力。通过分析大数据样本,识别潜在风险因素,制定更有效的风险管理措施,提升企业的全面性和安全性。大数据分析的工具和技术有Hadoop、HDFS、MapReduce、HBase、Hive、Spark和Flink等。
大数据分析的步骤主要有:第一步,数据收集。数据来源包括传感器、日志文件、数据库、API、社交媒体、电子邮件等。为了应对数据的多样性和规模,需要使用适当的技术和工具,如Web爬虫、ETL工具和数据集成平台。第二步,数据处理。包括数据清洗、数据转换和数据集成,确保数据的一致性和完整性。第三步,数据存储。要选择合适的数据存储技术和架构。第四步,数据分析。从数据中提取有价值的信息和知识。分析方法包括描述性分析、诊断性分析、预测性分析和规范性分析。第五步,数据可视化。将分析结果以柱状图、折线图、饼图、散点图、地理图等方式展示出来,增强直观性与解释力,帮助用户发现数据中的模式和趋势,支持决策过程。
曾多次参加江西财经大学举办的“华创杯”“正大杯”市场调查大赛论文评审与现场答辩,有一些大学生的论文使用了大数据分析法。通过Python等软件在网上抓取数据、开展数据分析、绘制大数据云图等,当代的学生们已步入一个与传统统计分析法迥然不同的天地。
(本文写作引用了《分享统计分析的快乐——概说统计分析的那些事》(统计与咨询2017年第2期)部分内容,参考引用了百度相关文章、AI助手提供的资料;本文谈到的统计分析方法是基于作者个人的经验与认知,实际上有很多方法还未知未用)