龙空技术网

浅谈数学中的特征工程——从数论中的取模与同余谈起

数学思维之道 679

前言:

此刻大家对“什么叫取模运算”都比较重视,咱们都需要知道一些“什么叫取模运算”的相关文章。那么小编也在网摘上汇集了一些关于“什么叫取模运算””的相关内容,希望小伙伴们能喜欢,姐妹们快快来了解一下吧!

我们通常所讲的”特征工程(feature engineering)”一般指的是机器学习领域中的概念,在数学领域中目前还没有听说有此概念。

本人一贯秉持”领悟与构建通透系统的数学思维方法论要多学科交叉融合”的理念,在这一理念指导下,本人认为在数学思维方法论中可以引入”特征工程”的概念,这两个领域中的”特征工程”肯定有区别,但在某些方面至少有些”神似”

机器学习中的特征工程

特征工程是将原始数据属性提炼转换为数据特征的过程,转换后的数据作为模型的训练数据。

假设我们要开发一个基于机器学习的疾病诊断系统。我们的原始数据是一些病人的电子病历,病历中包含多种属性信息,例如病人姓名、年龄、性别、就诊时间、主诉、现病史、既往史、个人史、婚育史、医生诊断结果等。

这些原始数据还不能作为训练样本直接用于训练疾病诊断模型,需要先进行特征工程将原始数据转化为可用于模型训练的样本集和测试集。

病历数据的特征工程主要有:

1.特征抽取:从非结构化的文本形式的属性中提取结构化的特征信息,例如从现病史中抽取症状

2.特征预处理: 归一化、标准化、降维。

3.特征选择:从大量的特征中选择少量的有用特征。不是所有的特征都是平等的,那些与疾病诊断不相关的属性需要被删除,例如姓名;还有一些特征可以比其他特征更重要。特征选择就是选择对于问题最重要的特征的一个子集。

特征工程

我们熟知的人脸识别服务,在构建人脸数据库和识别人脸时,也涉及到人脸数据的特征工程。

人脸特征点

如果想进一步了解”特征工程”的内容,可以在网上搜索。

数学思维方法论中的特征工程

数学问题中也存在特征信息,因此在数学思维方法论中引入”特征工程”应该是有意义的。

数学问题中的特征应该理解为对象(特征对象),特征对象包含特征属性,这些属性不一定是数值或数量,例如将军饮马问题中的主要特征就不是数值,而是“两定点在河的同一侧,或者说路线是折线”,用辩证法中的矛盾分析法来分析,就是折线与(结论所求)最小值的矛盾。

特征形形色色,种类繁多,有表层的有深层本质的、有可以表达可以言说的,也有只能意会的。对数学中特征的理解,可以先阅读本人先前的文章<基于特征和模式驱动的解题策略(原创)>。

数学思维方法论中的”特征工程”包含如下几个方面:

特征识别特征抽取特征增强特征选择特征构建特征转换

这里抛砖引玉,特征工程每一项的内容尚待进一步阐述,这里只就”特征抽取”稍作介绍。

数学中特征抽取的场景很多,例如在数学建模中进行模型抽象,去粗取精去伪存真,抽取本质属性、重要属性就是特征抽取。再比如统计分析中获取样本特征:平均值、中位数、标准差。

复数和数论中都有取模法,我们对整数代数式取模也是特征抽取,取模运算得到的余数就是该代数式的特征之一。这种特征抽取手段,好比化学中的萃取法或信号处理中的滤波器,还有简缩、析出、降维、分类器(按余数或是否同余分类)的意味。

多学科交叉融合的意义

业虽多分,道乃归一 。领域行业虽然很多,但它们在概念、方法、思维思想层面,越往上,越形而上,相通相似的越多,能借鉴的越多,例如物理学的等效思想就类似数学中的等价替换,生物学中的”结构决定功能”也能借鉴到数学思想中帮助我们理解改变问题结构的作用。哲学辩证法更是对我们领悟和运用数学思想方法有指导作用。

提倡多学科多层次的融合,还有一个原因是各学科素养、能力其实是相互补充相互渗透的,它山之石可以攻玉,数学为其他学科赋能就不说了,就拿语文学科素养对数学思维数学思想的助益来说,在领悟、提炼、运用数学思想方法的过程中,我们能深刻体会到语文学科培养的概括提炼能力的重要性,能体会到表达能力的重要性、能体会到成语在帮助我们提炼和领悟数学思想方法的重要作用,体会到综合素质的重要性。

旁征博引,在认知过程中,对一个领悟不深的事物,我们通过比喻、类比、隐喻、上下求索(向上提炼、抽象升华、形式化、模式化;向下具体化、形象化、直观化)、内引外联,从表层到深层全方位地、系统地、跨学科地、多维度地扩展对它的认知空间。从而同化它、顺应它、消化它、柔化它、丰富它、扩展它、感悟它、接纳它、联结它、融汇它。

如此,何愁我们的认知结构知识体系不能融汇贯通;何愁缺少解决问题的灵感;何愁我们的思维品质(思维灵活性、深刻性、系统性、批判性)不能逐步提高;何愁我们对各种数学思维方法、数学思想方法运用不自然自觉。

“问渠那得清如许 为有源头活水来”。

构建和领悟通透系统的数学思维之道,要有深厚的思想底蕴,深厚的思想底蕴是思维之道的源头活水,而深厚的思想底蕴,是由多学科交叉融合,沉淀而成的。

思维之道是一以贯之的,通透系统的数学思维方法论一定是多学科交叉融合的,至少要融合:思维学、语文、物理、化学、生物、哲学、心理学、认知学、逻辑学、教育学、艺术、信息论、控制论、系统论、军事学、刑侦学、佛道经典、日常生活等。

标签: #什么叫取模运算 #取模运算是什么意思