在数据方面,除了海量的优质数据,百度拥有大量自建的高质量数据,包括百度阿拉丁(优质资源开放平台)、百度知道、百度百科、知识图谱等,不仅可以支持结构化数据的文章的生成,还可以支持基于内容聚合方式的文章生成。百度阿拉丁的时效性结构化数据,如体育比赛、彩票、股票信息、恶劣天气预警等,是速报类文章生成的数据基础。百度百科、百度知道和知识图谱是知识类文章生成的重要数据来源。
以百度百科的城市百科为例,城市百科中包含了大部分城市的景点、美食、文化排行榜等数据,这些数据与对应景点、美食的描述数据相结合就可以生成城市旅游、美食、文化的介绍文字。同时,基于海量的用户行为日志数据,可以准确地捕捉对这些内容感兴趣的用户,就可以实现生成内容的个性化推荐和满足。
百度利用自身丰富的数据资源,包括百度阿拉丁、百度知道、百度百科等,支持结构化及聚合内容的文章生成。例如,通过结合城市百科中的数据,能够自动生成旅游、美食等领域的介绍文字,并基于用户行为数据实现个性化推荐。


被折叠的 条评论
为什么被折叠?



