标记我们的内容,但这远远不能描述文本本身中 数百 种可能的实体关联。 标记很困难。实际上,在一个有时很难让作者编写标题标签或让工程师将 属性附加到图像的世界中,实现适当的结构化数据以获取 源可能是一项艰巨的任务。 采用率低。去年对 亿个网页进行的一项研究表明,只有不到 的网页包含结构化数据标记。最近的一项 研究表明采用率更低,超过 万个域中只有 的网站使用 。 这对搜索引擎提出了挑战,搜索引擎希望了解 整个网络中的实体关系 而。
不仅仅是我们选择标记的部分。 实际上,搜索引擎已经工作了 多年 从早 哥伦比亚 WhatsApp 号码列表 期的 开始 在不使用复杂标记的情况下从我们的内容中提取实体。 搜索引擎如何在没有标记的情况下理解关系 这是一个复杂主题的简单解释。 搜索引擎可以使用三元组 的概念来构建您的内容 。这意味着将关键词组织成主语 谓语 宾语的框架。 像 这样的结构化数。
据框架非常有用,因为它们会自动将信息分类为三重格式。以 中的这个 例子为例。 头像 导演: (生于 年 月 日) 科幻小说 预告片 从此代码示例中提取三元组将产生: 阿凡达 电影 有导演 詹姆斯卡梅隆 主语 谓语 宾语 挑战在于:搜索引擎能否为 以上未标记结构化数据的内容提取此信息? 是的他们可以。 三倍,无处不在的三倍有多少宇航员登上月。




