系列文章目录
文章目录
- 系列文章目录
- 前言
- 一、谈谈分词与倒排索引的原理
- 二、说说分段存储的思想
- 三、谈谈你对段合并的策略思想的认识
前言
前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站,这篇文章男女通用,看懂了就去分享给你的码吧。
一、谈谈分词与倒排索引的原理
首先说分词是给检索用的。
英文:一个单词一个词,很简单。I am a student,词与词之间空格分隔。
中文:我是学生,就不能一个字一个字地分,我-是-学生。这是好分的。还有歧义的,使用户
放心,使用-户,使-用户。人很容易看出,机器就难多了。所以市面上有各种各样的分词器,
一个强调