云彩店邀请码|半壳|优胜
摘要:函数数据(Functional Data)是指一个集合,该集合中的元素均为定义在某个连续区间上的函数。函数是用以描述变量(或称集合)之间关系的工具。因此,以函数形式存在的数据广泛应用于社会科学和自然科学的各个领域。从十七世纪伽俐略提出函数概念算起,对函数的研究已经有了很长的历史。而函数数据则是1991年由加拿大统计学家Jim.O.Ramsay最早作为一种数据类型明确提出来的。与普通离散数据相比,函数数据可以包含更多信息、方便的利用原始数据中隐含的导数信息,数据采集也更加灵活。函数数据有助于广泛而深入的挖掘数据中的信息,对于人类认识自然、认识社会有着非常重要的意义。因此,在过去的近二十年中,函数数据在理论基础、分析技术和应用领域方面都得到了快速发展。Ramsay提出的函数数据分析(Functional Data Analysis,FDA)以函数数据为研究对象,包括了曲线平滑、曲线注册、函数数据主成分分析等各种分析技术。但函数数据的特殊性使得目前FDA领域的理论体系和分析技术与普通离散数据相比还逊色很多。因此,进一步深入研究和扩展FDA的理论基础、分析技术和应用领域是十分必要的。 本论文正是在这样的应用背景和研究基础上选题,基于FDA现有的理论体系,进行函数数据的多元分析方法研究。创新提出了一些函数数据多元分析的理论和技术。主要包括:函数数据的聚类分析方法、判别分析方法和函数数据的常系数多元线性回归建模方法。进一步完善了FDA的结构体系。同时,将提出的分析技术应用到实际研究领域。从理论基础、分析技术和应用领域三个方面增强FDA的理论深度和应用价值。本论文具体的研究内容包括以下五个方面。1.函数数据分析基础在着手进行函数数据多元分析方法研究之前,深入掌握函数数据领域的相关基础理论、已有研究成果和最新的研究方向,以及目前研究中遇到的难点和空白,为创新研究打下坚实的基础。主要内容包括:函数数据的获取、函数数据的平滑、曲线注册、函数数据主成分分析和平滑主成分分析等方法。2.函数数据聚类分析方法在介绍普通离散数据聚类分析方法的基础上,本论文创新提出了函数数据的距离概念,并进一步把函数数据样本之间的距离与高维向量空间中样本之间的欧氏距离进行了比较,研究这两个空间中样本之间距离的关系。在此基础上,提出了两种函数数据的聚类分析方法:函数数据系统聚类分析法和K-means聚类分析法。3. 函数数据判别分析方法在函数数据聚类分析的研究基础上,进一步研究函数数据的判别分析方法。基于与前述聚类分析同样的距离定义,提出了函数数据的距离判别分析方法和Fisher判别分析方法。4.函数数据的常系数多元线性回归模型本论文着力研究函数数据的常系数多元线性回归模型;在给出函数数据点积定义的基础上,提出了一种函数数据常系数多元线性回归建模的方法。讨论了模型计算过程中的一些细节问题:如何定义函数数据的常数型均值、方差、协方差和相关系数,以及在建模过程中的数据中心化和标准化问题、函数数据的多重共线问题,和基于Gram- Schmidt 正交变换的变量筛选方法等。对于回归模型的拟合效果,也给出了复测定系数以及拟合相对误差两种评价方法。5.应用研究针对本论文创新提出的函数数据多元分析方法,各章中都分别进行了实证或仿真研究,在探讨解决相关领域实际应用问题的同时,验证本论文所提方法的有效性。应用研究包括:人体四肢血管多普勒超声造影和法国达能集团食品加工工艺数据的分类研究,以及中国宏观经济数据的回归分析。
来源:半壳优胜鲸鱼幸运星转载请保留出处和链接!
本文链接:http://87cpy.com/210061.html
本站部分内容来源网络如有侵权请联系删除