问题:请问我这里有一篇文章,像百度依靠哪些技术来提取这个文章的最突出的文字的?依靠代码内容还是统计频率最高的关键词
参考答案:正如搜搜这样的成熟运营的引擎服务商,他们会有容量很大的关键词库与语言提取算法,能够将记录到的每篇文章的主要文字,对比重要部位的,相关词语,站内相关内容等主要特征来比较,使得得出一篇独立页面的最突出的文字。
如果单纯地依靠文章标题又或是主要的词语,假如遭遇写这些文字的编辑不怎么精准,或表现情景意义不大的词语大量展示,导致提取不正确。