机器学习算法需要大量的有标注的样本数据,对于图像分类,经常需要使用上千万张有标注的图像来进行训练。对于语音识别,需要成千上万小时有标注的语音数据。对于机器翻译,通常是在千万量级的双语语对上进行训练。但是很多领域却无法收集大数据,一是因为实例过少,例如医疗方面的疑难杂症;二是由于过于抽象,例如几何研究中的高维流形等。
此文由 怡心湖 编辑,若您觉得有益,欢迎分享转发!:首页 > 常识论 » 人工智能中的机器学习算法之概述
机器学习算法需要大量的有标注的样本数据,对于图像分类,经常需要使用上千万张有标注的图像来进行训练。对于语音识别,需要成千上万小时有标注的语音数据。对于机器翻译,通常是在千万量级的双语语对上进行训练。但是很多领域却无法收集大数据,一是因为实例过少,例如医疗方面的疑难杂症;二是由于过于抽象,例如几何研究中的高维流形等。
此文由 怡心湖 编辑,若您觉得有益,欢迎分享转发!:首页 > 常识论 » 人工智能中的机器学习算法之概述