编者按:本文来自微信公众号“大数据文摘”(ID:BigDataDigest),作者 易琬玉,36氪经授权发布。
刚刚送走了最热七月,转眼就迎来了最热八月。
2019年是人类有气象纪录以来最热的几个年份之一,虽然这个夏天还没结束,但气象学家们已经有十足把握做出这个判断。
为了应付热,人们想出了很多办法。在炎热面前,空调是安全感的来源,而西瓜,是幸福感的来源。
根据Worldatlas世界地图网2018年的数据,中国人一年要吃掉近800亿斤西瓜。中国的西瓜产量占全世界的70%,约为第二名的20倍,但这依旧无法满足广大吃瓜群众,几乎每年都要依赖进口。
为了提高瓜农收入,扩大西瓜的对外出口,也顺便造福一下我们广大吃瓜群众。三年前,有位浙江大学的博士毛建华,用近200个西瓜,写了篇近130页的博士论文,系统阐释了如何通过机器学习听声音辨别西瓜的成熟度。
古往今来传统挑瓜大法
古往今来,有一个全球通用的挑瓜窍门——敲它!
一般来说,未熟西瓜声音较清脆,敲打时会发出「咚咚咚」的声音,成熟瓜声音比较低浊,发声为「嘭嘭嘭」,而过熟西瓜则会发出「扑扑扑」的声音。
虽然在挑选西瓜时,“敲西瓜”是广为采用的方法。但是这种方法完全依靠经验且费时费力,无法用于大量检测。
作者在文中提到,西瓜是否适时采收对西瓜品质影响极大,过熟或者不熟采摘都会影响西瓜的品质与口感。在我国,采收时机主要还是依赖于瓜农的主观经验,他们往往通过生长周期、气候(主要是气温)以及观察瓜皮颜色、纹理来判断西瓜成熟情况。
我国西瓜产量和种植面积居世界第一,但是出口量却不到产量的1%。不仅是因为我们自己吃得多,还因为西瓜产后检测和处理手段落后,导致质量良莠不齐,商品化程度低。
科学挑瓜:声学无损检测技术
论文写道,水果内部品质无损检测是实现水果产后商业化处理的重要一环。随着现代计算机技术、图像处理技术、传感器技术和测量技术的飞速发展,无损检测技术以其非侵入、省时快捷的特点逐渐取代传统的有损检测技术,被广泛的用于农产品品质检测。
相较于其他的无损检测技术,声学检测具有速度快、准确度高、成本低的特点。
声学无损检测方法主要通过检测水果的质地来判定其成熟度或缺陷。西瓜的成熟度与内部结构和成分有关,而这些变化会反应在声音变化上。这个方法的原理和我们拍西瓜听声响是一个意思,只不过更加准确高效。
通过论文图标可以看到,装置包括敲击装置、托盘、麦克风、控制电路和上位机等。通过敲击装置撞击西瓜瓜皮发出声音,在控制电路作用下完成敲击信号采集,并传送给声学参数分析软件。
为了获得更准确的数据,作者对结构和材料都进行了优化处理。
首先是声音信号的预处理,包括敲击声音信号的端点检测和去噪。通过线性预测残差法结合切比雪夫I型低通滤波器进一步去除了原信号中的噪声与毛刺,在提高信噪比的同时,确保原有声学特征的准确提取。
一切准备就绪后,作者进行了两种试验,分别为成熟度分类试验和空心判定试验。
试验中选用的麒麟西瓜样本于2015年5月底至6月初从杭州市余杭区仓前镇吴山前村五组化农吕天欢处的温室瓜棚分四批次采摘,共计200个西瓜。这四挑样本分别作为未成熟样本、成熟样本、过熟样本和空心样本。
剔除在运输和搬运过程中损坏的样本后,剩余190个西瓜样本(49个未熟化+49个成熟瓜+49个过熟化+43个空心瓜)。将剔除空心瓜之后的147个西瓜随机分为校正集(75个)和验证集(72个),用于西瓜坚实度的定量预测的研究。
成熟度分类试验中,选用 147 个非空心瓜,随机分为两组:建模集 75 个,预测集 72 个。
空心判定试验中,选取 190 个样本(包含有空心瓜),随机分为两组,建模集 97 个,预测集 93 个。
建模集用来建立样本的分类或空心判定模型,预测集用来测试模型的性能。
试验采用了四种常见有监督机器学习算法和模式识别算法,分别是线性判别分析法(LDA)、K-最小近邻法(KNN)、BP 神经网络技术(ANN)和最小二乘-支持向量机法(LS-SVM),以声学特征对未熟、成熟和过熟三种西瓜进行了分类,此外还对空心瓜进行鉴别。其中,LS-SVM法分类效果最佳。
商品化处理关键环节,造福广大吃瓜群众
水果内部品质检测是实现商品化处理的关键环节之一,提高果农和销售商利润,满足消费者对水果品质不断提高的需求,扩大出口。
作者成功设计了一套便携式西瓜成熟度分类和空洞判定的声学检测试验装置。目前仅有少数发达国家研制出了商用化的西瓜品质无损在线检测设备,国内尚无同类产品。
之前陕西师范大学博士孙灵霞的八万字论文《八角茴香对卤鸡肉挥发性风味的影响极其作用机制》引发网友热议。
论文主要讲了加入八角茴香和没有加入八角茴香的卤鸡肉到底有什么区别,通过这种对比来了解风味在卤煮过程中有什么影响,风味是如何形成的。了解卤煮的温度、火力、加热时间,让风味达到可控,对于后面的风味的调控和控制才能起到指导作用。
尽管大家都在调侃用掉了多少鸡肉,是否需要帮忙如何处理实验材料,但是孙灵霞博士及其团队的部分研究成果已经被推向市场了。正如她所表示的——研究目的是想要克服传统工艺的弊端,保证品质的一致和稳定,把中国的卤煮推向世界。
这和本文关于西瓜检测的论文作者毛建华的目的不谋而合——提高中国西瓜的商品化、扩大出口。这些题目看起来不那么学术科研工作,背后其实都是科研工作者满满的努力和情怀。
用机器学习科学吃瓜,你学会了吗?
参考资料:
https://kns.cnki.net/KCMS/detail/detail.aspx?dbcode=CDFD&dbname=CDFDLAST2017&filename=1017071405.nh&uid=WEEvREcwSlJHSldTTEYzVnB3WXI4eW9qNkhrMjdqZFpPYzR4Yk5hVm0zZz0=