AI的尴尬：Gemini自曝秘密，高质量数据即将枯竭？

cl15 • 2023年12月19日 16:17:55 • 新闻 • 178 views

最近，Gemini模型搞了个大新闻，竟然承认自己是用“文心一言”训练的中文语料。这听起来像是个玩笑，但背后的问题可不小。网上的大V「阑夕」在Poe网站上一试，果然如此 — Gemini直接承认了。

这件事引出了个更大的问题：互联网上的高质量数据正在迅速枯竭。专家们担忧，如果这种趋势持续下去，明年就可能面临数据荒。

再说回Gemini，它还说自己的创始人是李彦宏，还大赞他是个有远见的企业家。问题是，这是因为数据清洗没做好，还是调用API出了错？目前还没个准信。

还记得今年3月，谷歌的Bard吗？曾有传闻说它的训练数据部分来自ChatGPT。因为这个，Bert的创造者Jacob Devlin都跳槽到OpenAI去了，还曝光了这个内幕。

这些事情提醒我们，AI的关键不仅仅在于模型，还在于优质的数据。但现在，好像我们都陷入了数据荒。高质量的语料，尤其是未被污染的那种，越来越难找了。

据说去年11月的一个研究表明，机器学习的数据集可能在2026年前就会耗尽所有“高质量语言数据”。OpenAI也公开说过他们数据告急。这下，我们的AI朋友们可怎么办呢？

最近，有些公司开始采用专有数据来解决这个问题。比如OpenAI就和Axel Springer合作，使用他们的数据来训练模型。这似乎成了获取高质量数据的一个新途径。

但这样的解决方案不是每个人都用得起的。开源模型可能会因为拿不到这样的数据而落后。就像早前Bloomberg使用自己的金融文件作为训练语料，那效果就很明显。

所以，看起来，我们的AI朋友们在数据上还得多下点功夫，不然错吃了自己生成的错误数据，将来可能真的会有大麻烦。

结语： 这个故事告诉我们，AI技术的发展不仅需要强大的算法，还需要干净、多样的数据源。看来，保护和维护这些宝贵的数据资源，是大家都应该关注的问题。

本文来自投稿，不代表TePhone特锋手机网立场，如若转载，请注明出处：https://www.tephone.com/article/1601

AI Gemini 文心一言高质量数据

讚！ (0)

cl15编辑

0 0

Mr. Cooper黑客窃取了1400万客户的个人数据

Previous 2023年12月19日 15:53:25

特斯拉Tesla积极研发感应充电技术，为解决电动汽车充电问题努力

Next 2023年12月19日 16:26:06

新闻

美国司法部拟对苹果提起反垄断诉讼，苹果应对压力增加

最近，关于欧盟对科技巨头如苹果进行打压的消息频繁出现，特别是数字市场法案（DMA）对 iPhone 生态系统的影响。然而，现在苹果似乎也在美国面临着巨大的压力。据彭博社报道，美国…

binbin
2024年3月21日
21000
安卓

2024年“Made by Google”活动：期待Pixel 9 Pro Fold、智能手表、Android 15、AI等

Google将在两周后的“Made by Google”年度活动中展示最新的Pixel硬件产品，包括Pixel 9系列、Pixel Buds Pro 2和Pixel Watch 3…

偌岸丶
2024年8月5日
23000
新闻

微软推出iOS版Copilot应用程序，让您体验最新的AI聊天机器人功能

微软近日在Android平台推出了Copilot应用程序后，现在又推出了适用于iOS和iPadOS的应用程序。这两个版本的应用程序现已可以从Apple App Store上下载。 …

聆听
2024年1月3日
26300
新闻

为什么Gas Hero会成为下一个定义链游的App？

在这篇文章中，我将探讨为什么Gas Hero将成为下一个定义链上游戏的应用程序，以及即使你不是游戏玩家，为什么这对你（和$GMT）很重要。 StepN的背景两年前，我们让Step…

聆听
2024年1月2日
15600
新闻

SignalPlus宏观研报：BTC暴跌超5000美元，6亿美元多头被清算，全球资产市场面临风险挑战

随着数字货币市场的波动，最新的SignalPlus宏观研报为我们呈现了一系列全球资产市场的关键动态。在这篇报告中，我们将概括研报内容，深入分析加密货币、美国经济数据、以及美联储的政…

cl15
2024年1月5日
16200
新闻

江淮钇为钠离子纯电量产车下线，开启全球首款新纪元

江淮钇为（JAC Yihua）在科技领域再次引领潮流，他们的全球首款钠离子纯电动量产车——钠电版花仙子，在今日正式下线。这款创新车型将于明年一月开始批量交付给消费者，为电动车市场注…

Ai-i
2023年12月27日
17000
安卓

荣耀 Magic6 至臻版和 Magic6 RSR 保时捷设计手机今日开售，价格公布

今日上午 10:08，荣耀 Magic6 至臻版和 Magic6 RSR 保时捷设计两款新机正式开售，售价分别为 6999 元起和 9999 元。荣耀 Magic6 至臻版荣耀…

Android
2024年3月22日
50200
新闻

NASA宣布阿耳忒弥斯Ⅲ载人登月计划调整，推迟至2026年9月

美国国家航空航天局（NASA）今日发布了对其阿耳忒弥斯计划的最新调整，将原定于2024年的“阿耳忒弥斯Ⅱ号”载人绕月飞行任务推迟至2025年9月，同时将原定于2025年的“阿耳忒弥…

Android
2024年1月10日
24600
新闻

苹果TestFlight测试服务器数据泄露：1.2TB的数据包含《愤怒的小鸟》等游戏

近日，苹果公司旗下的TestFlight测试服务被发现存在数据泄露的问题，这些数据通过Wayback Machine存档，并匿名分享到Twitter。这次泄露事件被称为&#8221…

cl15
2023年12月19日
19100
新闻

Apple News Plus现已支持离线模式

即使订阅者身处无法接收到蜂窝网络或Wi-Fi信号的地方（或者发生了大规模的停电），在iOS 17.5上，Apple News Plus现在也可以提供内容，因为它增加了离线模式——这…

tp_admin
2024年5月14日
17700
安卓

谷歌推出适用于安卓设备的“查找我的设备”网络，可追踪丢失设备并兼容第三方追踪器

4 月 9 日消息，谷歌今日推出了适用于安卓设备的“查找我的设备”网络，其功能类似于苹果的“查找”网络，旨在帮助用户定位丢失、被盗的安卓产品。 IT之家注意到，与苹果的“查找”网络…

偌岸丶
2024年4月9日
23000
新闻

X（Twitter）平台取消短信验证引入 Passkey 支持，提升账号安全性

社交媒体平台X（Twitter）在去年发布公告，针对没有购买 Premium 订阅的普通用户取消了SMS短信验证，这种双因素身份验证（2FA）方法。为了进一步提高账号安全性，近日推…

tp_admin
2024年1月24日
35600
新闻

三星电子获得2纳米AI芯片订单，晶圆代工新战场竞争激烈

在最近的2023年第四季度业绩公告中，三星电子的Foundry（晶圆代工）部门宣布成功获得了一份2纳米AI加速器订单，该订单还包括配套的HBM内存和高级封装服务。三星在公告中指出…

cl15
2024年2月5日
30400
新闻

华为即将推出一款“小型”可折叠手机

尽管华为在美国被禁止销售其产品，但这并不意味着这一曾经的智能手机制造巨头已经失去了竞争力。每年，我们都看到华为推出了大量设备，这些设备在性能上堪与其他品牌一较高下，但令人遗憾的是缺…

tp_admin
2024年2月1日
20300
新闻

4 年寿命已到，三星 Galaxy A51 5G 等手机结束支持：止步安卓 13

6 月 5 日消息，三星公司本周发布公告，向符合条件的 Galaxy 智能手机和平板详细介绍了 2024 年 6 月安全更新内容，此外还调整了设备清单，表示已终止对 Galaxy …

cl15
2024年6月5日
18700
新闻

Invoxia推出Minitailz智能宠物追踪器，结合AI技术实时监测猫狗健康状况

在CES 2024中，Invoxia公司亮相推出了一款名为Minitailz的智能宠物追踪器，这是一种专为猫狗设计的“AI可穿戴设备”，售价为99美元（约合709元人民币），用户还…

小雨
2024年1月9日
51500
新闻

比亚迪仰望 U8 玩家版携手大疆：全球首发车载无人机，自动换电、一键起飞

近日，在比亚迪梦想日上，比亚迪正式宣布其仰望 U8 玩家版将全球首发大疆车载无人机，实现了整车与无人机的完美融合。这标志着比亚迪与大疆合作的重要成果。比亚迪仰望 U8 玩家版将配…

Apple
2024年1月17日
19700
新闻

SEC假消息引发比特币市场动荡，10亿美元ETF资金或涌入

美国SEC在2024年开年首次制造大乌龙事件，其假消息震惊了1.7万亿美元的加密市场。事件发生在北京时间1月10日凌晨，SEC在社交媒体发布了一条声明称批准比特币ETF在所有注册的…

Tech News
2024年1月11日
17600
新闻

曝光：NSA暗中购买美国人网络数据，隐私受到冲击

国家安全局（NSA）已经开始从商业数据经纪人那里购买美国人的网络浏览数据，情报官员在周四公开的文件中披露。这些文件是美国参议员罗恩·怀登（Ron Wyden）最近几周收到的五角大楼…

聆听
2024年1月29日
19800
新闻

华为麒麟芯片支持的手机销量在第四季度暴涨近25000%

2023年第四季度，MediaTek成为最大的芯片制造商，其芯片在全球范围内的智能手机出货量达到1.17亿部。这意味着与去年同期相比，该芯片制造商的出货量增长了21%。其旗舰芯片D…

小雨
2024年3月7日
32900

AI的尴尬：Gemini自曝秘密，高质量数据即将枯竭？

相关推荐

發佈留言