01《全唐诗》与大数据的结合
一部包含四万多首诗的《全唐诗》,或许穷尽一生也难以尽读,然而在大数据时代的今天,一种全新的阅读方式应运而生。这就是通过数据分析的视角来解读《全唐诗》。
当《全唐诗》遇见“大数据”,会碰撞出怎样的火花?经过逐字切分并去除虚词如“之乎者也”的预处理后,我们进行了常规的字频统计。结果显示,《全唐诗》中出现频率最高的字竟是“人”。
此文由 怡心湖 编辑,若您觉得有益,欢迎分享转发!:首页 > 会·生活 » 《全唐诗》大数据解读:字频与情感的多面展示
01《全唐诗》与大数据的结合
一部包含四万多首诗的《全唐诗》,或许穷尽一生也难以尽读,然而在大数据时代的今天,一种全新的阅读方式应运而生。这就是通过数据分析的视角来解读《全唐诗》。
当《全唐诗》遇见“大数据”,会碰撞出怎样的火花?经过逐字切分并去除虚词如“之乎者也”的预处理后,我们进行了常规的字频统计。结果显示,《全唐诗》中出现频率最高的字竟是“人”。
此文由 怡心湖 编辑,若您觉得有益,欢迎分享转发!:首页 > 会·生活 » 《全唐诗》大数据解读:字频与情感的多面展示