AI读网页，这次真不一样了[谷歌Gemini解锁「详解网页」新技能-58码农网

标题：谷歌Gemini解锁「详解网页」新技能
正文：
谷歌一直在不断探索和开发新的AI技术，以提升用户在搜索和浏览网页时的体验。近日，谷歌推出了一项名为Gemini的新技能，它能够更深入地理解网页内容，为用户提供更精准的信息和更便捷的浏览体验。
Gemini是一项基于自然语言处理和机器学习技术的AI技能，它能够通过分析网页的文本、图像、视频等多种内容，理解网页的主题、意图和关键信息。这使得Gemini能够更好地理解用户的搜索意图，提供更符合用户需求的搜索结果。
除了理解网页内容，Gemini还能够根据用户的需求，对网页进行个性化的展示。例如，当用户搜索某个特定主题时，Gemini可以根据用户的搜索历史和偏好，推荐相关的网页和内容，帮助用户更快地找到所需的信息。
此外，Gemini还能够与谷歌的其他AI技术进行协同工作，为用户提供更全面的搜索和浏览体验。例如，当用户在搜索某个地点时，Gemini可以结合谷歌地图和其他相关数据，为用户提供更准确的导航和位置信息。
总的来说，谷歌Gemini是一项非常强大的AI技能，它能够帮助用户更好地理解网页内容，提供更精准的搜索结果和更便捷的浏览体验。随着谷歌不断开发新的AI技术，我们有理由相信，未来的搜索和浏览体验将会变得更加智能和高效。

相关内容：

“喂，Gemini，帮我扒一下特斯拉财报第4页的负债数字。

”

一句话，50页PDF秒开，数字直接跳出来。5月28号谷歌把这事做成了官方功能，叫URLContext，开发者再也不用自己写爬虫、切文本、跑向量库，直接甩个链接就行。

听起来像魔法，其实只是把原本藏在后台的“外挂”翻到了前台。

先说最痛的那一点：以前想让AI读网页，得先“翻译”成文本，再切块、向量化、存库、检索，一套下来头发掉一半。

现在？

三行代码，34MB以内的网页、PDF、PNG、CSV统统吞进去，连脚注里带星号的隐私声明都能拎出来。

ThomasReid拿特斯拉Q1财报试了试，模型不仅找到“总资产”和“总负债”，还把旁边的小字备注一并念了，省得他再开Excel。

省步骤就是省钱。

谷歌的算盘打得响：第一次访问先查缓存，命中就白嫖，没命中才现场抓。

抓回来按Token计费，开发者自然会挑重点URL，而不是无脑扔20个链接。

付费墙、YouTube、GoogleDocs这类有自家API的地盘，它礼貌地不进去，既不得罪同行，也避免版权雷区。

有人担心这是要革RAG的命。

倒也没那么夸张。

内网里那堆带权限的HR手册、合同扫描件，URLContext够不着，传统RAG还得继续搬箱子。

但公开网页、研报、说明书这类“谁都能看”的内容，确实不用再搭一套重系统。

就像外卖和厨房的关系：家里偶尔炒个菜还行，天天请客还是交给专业厨师。

更野的想象在后面。

既然PDF里的柱状图能读懂，下一步是不是直接把财报电话会议的录音扔进去？

让模型一边听CEO的“预期管理”，一边对照PPT里的曲线，自动标红“画饼”部分。

到那天，分析师的通宵赶报告可能真会变成“点两下鼠标”。

不过别急着欢呼。34MB上限意味着超长年报得分段传，实时抓取还有网络抖动的风险。

以及，缓存命中率到底多高？

谷歌没给数字，只能等第一批开发者跑完账单才知道。

要是缓存老miss，Token费烧起来也挺肉疼。

总之，URL Context像一把新扳手，拧公开网页的螺丝又快又省力。

但内网的锈钉、私密的暗格，还是得老工具慢慢敲。

下一步，就看谁家先把这把扳手玩出花来。

相关内容：

给这篇文章的作者打赏

关于作者: 网站小编

相关文章

[记录] SSMS 20 geometry 支援度

[AI] Azure Document Intelligence自订模型的栏位

苹果手机快捷指令更换“图标”的方式

热门文章

1iPad 2018电容笔平替大揭秘,优选10大苹果Pencil最佳替代品推荐！

2iPad手写笔品牌盘点,推荐10大优质平替电容笔，入手必备神器！

3iPad必装生产力神器 DeskIn！远程连接电脑，轻松秒变高效工作利器

42025年性价比之选,不买原装也OK！10大精选iPad笔评测推荐

5有了 Apple Pencil，iPad 变得更实用的10大理由揭秘！