familia到底是什么
Familia百度开源的文档主题推断工具、语义匹配计算工具。
主题模型在工业界的应用范式可以抽象为两大类: 语义表示和语义匹配。
- 语义表示 (Semantic Representation)
对文档进行主题降维,获得文档的语义表示,这些语义表示可以应用于文本分类、文本内容分析、CTR预估等下游应用。
-
语义匹配 (Semantic Matching)
计算文本间的语义匹配度,我们提供两种文本类型的相似度计算方式:
- 短文本-长文本相似度计算,使用场景包括文档关键词抽取、计算搜索引擎查询和网页的相似度等等。
- 长文本-长文本相似度计算,使用场景包括计算两篇文档的相似度、计算用户画像和新闻的相似度等等。
继续阅读