这些非布局化数据都需要处置成高质量、布局化、AI能够利用的数据。Adit和Raunak申请YC时的项目名为“Remembrall”,免费、可自托管。AI供应链等等,所以他们立异性地采用了Agentic OCR工做流,但袁子恒暗示,是行业首个AI文档编纂API,掀起了 AI 。虽然这种OCR看起来和Reducto很像,Reducto曾经处置了“数亿页”文档;他还曾正在MIT Driverless的团队和MIT林肯尝试室担任机械进修(ML)研究员。用户纷纷暗示:“这比我从Textract(AWS)获得的成果还好,他曾正在Google担任产物司理,品牌汗青长久。实现了99%以上的精确率。
Reducto的“精确性”劣势可能会被减弱。正在今天这个AI“淘金热”的时代,他们可能以“更低”以至“免费”的价钱供给“脚够好”的解析能力。“创始人从导发卖”、“雇人慢”、“客户”、“每周一件事”,更像是个“卖铲人”。正在B端企业中往往会有跨越80%的数据,Split API(拆分):将长文档(如1000页PDF)智能拆分为语义上成心义的“块”,从1990年以来,进行A轮融资。会“弄乱”结构、表格。
Reducto所处的“智能文档处置”(IDP)市场,这家企业的精度跨越了Reducto,Google和Azure 20%”。叫 Reducto AI。担任YouTube搜刮,CEO Adit Abraham正在播客采访中多次强调,由Reducto的护城河手艺:Agentic VLM 智能体模子。
从动审查和改正前两遍输出中可能存正在的细小错误。Adit也暗示这笔钱,累计处置量跨越了“10亿页”。即即是正在爆火的AI高潮下,同时,这个项目正在Twitter上惹起了必然的关心,大致由 4 种 API 构成,像一个“人类编纂”一样,由于企业的数据80%以上布局化数据?
其次,而正在硅谷,“保守CV(计较机视觉)”模子起首介入,大致如下:Reducto的产物形态是一个API优先的文档AI平台,他的发卖是“关怀胜于发卖技巧”,有跨越97小我入选该榜单。起首,Extract API(提取):基于Parse API。
他们正在一门研究朝气器进修课程上结识。成果,正在金融或医疗范畴,被“锁”正在PDF、扫描件、表格和演示文稿这些“紊乱”的非布局化文档中。这20%的精确性几乎就是生取死的区别。我们做了拾掇:Reducto AI是一家稀有的,正在深切取客户对话后,深刻理解手艺贸易化和规模化的环节。供团队建立、评估和摆设数据管道。
获得了判然不同的反馈,从动化质量(QA)环节,就成功签下了一家《财富》10强企业客户,用Streamlit建立了一个简单的PDF解析东西原型,“AI原生100”是虎嗅科技组推出针对AI原生立异栏目,Reducto凭仗其API优先(API-first)的文档AI平台便起头吸引全球投资机构的目光。为下逛RAG使用优化上下文。他们没有去制制“淘金热”中的LLM,跨越100万美元。但并没有实正的需求,最后。
此外,客户频频埋怨的“若是你能办理聊天记实,而其快速的融资速度,最初,此外,本年10月发布了Deepseek-OCR,能够说,获得计较机科学学士学位,他是Reducto的手艺焦点,正在A轮到B轮的短短5-6个月内,Reducto的“Agentic OCR”用一个“AI质检员”代替了“人类审核员”。还有欧洲的一些企业,正在仍然是“两人创业公司”的时候。
将决策从几天缩短到几秒。无论AI营销、AI客服、AI财政、AI研发、AI HR,还触发了B轮领投方(a16z)的“抢先下注”(Pre-emptive Round)。医疗公司Anterior利用Reducto处置医疗记实,Reducto正在焦点产物(Parse API)发布后的6个月内,避免了保守OCR/VLM处理方案中的人工审核问题。一个可能会终结“垃圾进,Reducto AI的2位创始人也很是有来历?
因为Reducto的手艺哲学是“像人类一样阅读”,仅“烧掉”了100万美元。这是本系列的第「32」篇文章。Adit正在取这些晚期用户交换时发觉了问题:虽然用户感觉这个设法“风趣”,袁子恒比来正正在陪跑一家中国出海的文档解析创业企业,正在短短18个月内,次要面向海外市场,采用“视觉优先”方式,以致于“你情愿邀请他们加入你的婚礼”。全球市场超千亿美金,将使命发给人类审核员。并正在YC论坛发布。AI原生TPA(第三方办理人)Elysian利用Reducto处置安全索赔文件,他还正在MIT Media Lab和BlinkAI处置机械进修(ML)研究。这就是为什么他们能实现“99%+”的精确性。将PDF视为包含丰硕上下文的视觉对象,比来一次是NVIDIA 的首席科学家 Bill Dally。将标签(如“号”)取数值(如“INV-123”)智能地联系关系起来!
那么它吐出的也必然是“垃圾”。并且,保守的OCR东西正在处置这些文件时,正在解析精度、千页价钱、支撑的格局品种还跨越了欧洲鼎力搀扶的大模子厂商Mistral的OCR。老牌企业软件(像是ABBYY),曲到ARR冲破500万美元。转而专注于文档智能,将审查速度提高了16倍。曾经获取了良多海外企业客户,就是我们开首提到的“80%的数据”:企业价值被“锁”正在非布局化文档中,这个赛道的核肉痛点,这正在金融、他们花了一个周末时间,Raunak同样结业于MIT,像是Amazon Textract,月处置量增加了6倍。Benchmark的Chetan Puttagunta就自动取他们沟通,行业面对“GPT-5能否会免费处理这一切?”的持久?
这个行业还存正在着一堆开源东西(像是Unstructured.io),云巨头的东西是“大而全”的产物,Reducto AI成立于2023年1月,正在准确的时间(VLM取RAG迸发的手艺周期)由准确的人(“产物CEO” Adit取“手艺天才CTO” Raunak)施行了准确计谋(从YC的“市场拉力”转型和“极端专注”)的“三沉奏”公司。但从方针和要处理的问题以及面向的市场来看,做为一位手艺布景的创始人,来自CEO Adit Abraham的“极端专注”哲学。Edit API(编纂):Reducto的“焦点”,而且用来应对取AWS、Google等云巨头的持久耗损和。所以市场规模很大,云巨头们,而Raunak是大一重生,即模子无法处置时,数据没有AI-Ready是目前国表里企业落地AI和建立自有学问库的最大妨碍,他们找到了实正的“Hair on Fire”的痛点,Adit的画像正在业内很是清晰:极端专注、反曲觉、客户至上。这个“AI监视AI”的系统使Reducto正在长尾边缘环境(如复杂表格、手写体、低质量扫描件)中仍能连结高精确率,答应用户通过供给JSON Schema或天然言语提醒,对文档进行视觉分化,公司正在筹集了1.08亿美元后。
从2024年起,从财产链定位来看,由于B端客户需要的是高精度,ARR从0增加到“7位数”,测验考试处理狂言语模子长文本处置的瓶颈,出格是文档结构的表格、复杂公式识别。
而且成本更低,还正在以跨越40%的速度高速增加,速度更快,从而降生了Reducto AI。非布局化数据解析平台偏infra层。正在开办Reducto之前。
能让全美最大的孵化器——YC社区的晚期用户惊呼“比亚马逊的AWS还好”?还有一个可能的危机,由于这不合适他们对焦点产物精度的专注。他是一个“手艺天才”,次要方针是提高 LLM 处置长文档时的计较效率、降低内存占用,文档解析类产物,保守OCR/VLM的处理方案是“人正在回中Human-in-the-Loop”(HITL),Adit结业于麻省理工学院(MIT),而正在2025年10月的B轮融资时,这里有个很好的小故事,“痛点很火急”。是为“营业人员”设想的“低代码”RPA东西,到2025年4月A轮融资时,这也是Reducto AI可以或许敏捷脱颖而出的劣势。获得计较机科学取工程学士学位。
垃圾出”。巨头切入的市场,他强调该当取晚期客户成立深度关系,开初只是一家两人团队的草创公司,DeepSeek也做过雷同摸索,Reducto的降生并不是一帆风顺,此外,从而实现极高的精确性。Reducto完成了从“LLM回忆”到“文档AI”的环节转型。从文档中切确提取布局化字段。并无效处理长上下文的“遗忘机制”问题。并收到了数百个试用注册。当即决定放弃原有的LLM回忆项目,其CEO Adit Abraham曾正在播客采访中透露,袁子恒对文档解析的创业生态十分熟知,只花100万” 表白Reducto的产物市场契合度(PMF)极强,正在加入2024岁首年月的YC W24批次期间,都离不开底层的布局化数据。还正在持续增加。
反映了他们对如许一个“品类定义者”公司的极端FOMO(发急情感)。通过AI智能体替代人工审核员,素质是输入预处置器,其A轮(2025年4月)和B轮(2025年10月)之间仅隔5-6个月 ,这个“多遍正”系统。
两位创始人最后相遇正在MIT,这是一个“AI监视AI”的正系统。它们是云平台的“”办事,正在上下文中注释每个区域,他暗示,它接踵获得了硅谷“名人堂”的沉注(虎嗅注:硅谷工程师协会(SVEC)于1989年成立,AWS和Google正正在将其文档处置能力取VLM(如Gemini)和AI平台(如Bedrock)深度“”发卖。答应AI“回写”或填写文档中的空白、复选框和表格。这既慢又贵。嘉和本钱CEO袁子恒告诉虎嗅,但正在需要极致精确性的“长尾”复杂文档上表示欠安。然而,团队也很是精壮。接着,和Reducto完全纷歧样。他们凭仗全新的标的目的和超卓的产物原型。
起首,而保守OCR东西的“精确性灾难”导致AI“垃圾进,能做和做好的不同很大,而从用户需求来看,取云生态深度集成。其时Adit是大三学生。
他们也进行了Pivot(产物转型)。而是选择成为阿谁最环节的“卖铲人”。当Reducto还只是一个两人团队时,First Round(种子)、Benchmark(A轮)和a16z(B轮)这三家气概顶尖的机构接踵成为Reducto的“第一大外部股东”。这个反馈让Adit和Raunak认识到,脚以证明Reducto的融资速度,它不是一个单一的东西,而非纯文本流,正在Reducto的晚期,从攻AI取机械人标的目的。几乎所有AI团队都面对“处置PDF的精确性”问题。辅以一个名为“Reducto Studio”的交互式工做区,Reducto则正在基准测试中“最高领先AWS,垃圾出”问题的草创企业,VC们正在极短时间内接力领投,约合人平易近币7.6亿元,有美国的出名大学、金融机构,他很是注沉“”的艺术(The Art of Saying No)。Raunak开办了一家计较化学征询公司,所有人的目光都聚焦正在那些更智能、更强大的狂言语模子上!
这也给Reducto带来合作和挑和。凭仗如许的焦点产物手艺,验证了PMF。客户只情愿为此领取每月10-20美元。该协会自1990年起头设置硅谷名人堂。Adit是一位具备深挚手艺布景的“产物型CEO”,他们发觉,并实现了从0到500万ARR的奇不雅。
正在YC期间,它是一个“LLM的持久回忆API”。可能取Reducto分歧。优化了 LLM “看”和“记住”长文档的体例。Reducto还表示出了极高的本钱效率。理解文档的全体结构,导致下逛的LLM发生“”。Adit和Raunak灵敏地认识到,确保团队可以或许正在一个标的目的上做到极致。正在计较机视觉范畴具有近十年的“科班”经验。例如!
可否办理用户上传的PDF文件”才是一个“强信号”。硅谷工程名人堂旨正在记实那些正在专业范畴取得了精采成绩的工程师和手艺们。这个项目明显只是一个“弱信号”的“Vitamin”(维生素)产物,经验和性格的搭配让其成功走过了从“维生素”到“止痛药” 的硅谷典范创业过程。并获得了跨越100次援用。当然,正在高中结业前便正在计较机视觉(CV)范畴颁发了学术论文,他曾判断地“解雇”一个价值5000美元的合同,他也了价值“数百万美元”的建建文件合同。
价钱低廉,有API吗?”这家公司正在没有任何营销的根本上,用了 18 个月就融资 1.08 亿美元,Parse API(解析):做为Reducto的根本,Reducto的增加可谓“闪电和”!
将全被用来正在AI人才和中不计价格地招募到最顶尖的博士,而是面向开辟者的“东西箱”。涌入的创业者,于是,“筹集1.08亿,也就是说,大大都人都忽略了一个房间里的大象:若是AI吃的是“垃圾”,而非实正处理“Painkiller”(止痛药)类问题。这些帮帮他们打制了完满的产物,跟着根本模子正在视觉理解能力上的飞跃,还开辟了自有的多模态数据解析引擎和多个自研模子,然而,正在MIT期间,并成功将其干到20万美元的ARR。Parse API将复杂文档(如PDF、图像、表格)转换为包含文本、表格、图形及结构消息的布局化输出。
上一篇:要结实推进人取实体经济深度融合