【GitHub】Unlimited-OCR：用 R-SWA 注意力机制，把 OCR 推进 “一口气“ 解析数十页文档时代

发布时间：2026/6/30 14:17:38

【GitHub】Unlimited-OCR：用 R-SWA 注意力机制，把 OCR 推进 “一口气“ 解析数十页文档时代

论文:Unlimited OCR Works (arXiv:2606.23050)代码:github.com/baidu/Unlimited-OCR模型:百度 PaddlePaddle 团队出品 | 3B MoE (激活 500M) | MIT LicenseTag:R-SWA · One-shot Long-horizon OCR · Constant KV Cache · DeepSeek-OCR 继承者一、介绍2025 年，DeepSeek-OCR 用 “视觉压缩 + LLM 解码” 的范式把 OCR 带到了一个新高度——一张 A100 一天能跑 20 万页文档。但问题也随之而来：随着解码 token 数增长，KV Cache 线性膨胀，推理越来越慢。直观感受就是：翻一页快，翻十页开始卡，翻五十页直接 OOM。这跟人类抄书的行为完全不一样——人抄一页书，不会因为抄到第 50 页就变慢。你的大脑不需要在翻到第 50 页时还"回忆"第 2 页写过的每一个字。百度 PaddlePaddle 团队抓住了这个直觉，提出了Unlimited-OCR/

相关新闻

NR RRC连接态测量：从配置到触发的全流程解析

NR RRC连接态测量：从配置到触发的全流程解析

2026/6/30 14:17:38

1. NR RRC连接态测量基础概念在5G网络中，终端设备（UE）与基站（gNB）建立RRC连接后，会持续进行各种测量任务。这些测量结果直接影响着网络的质量评估、切换决策和资源调度。简单来说，就像开车时需…

JMeter性能测试实战：从卡顿优化到高并发场景设计

JMeter性能测试实战：从卡顿优化到高并发场景设计

2026/6/30 13:57:13

1. 项目概述：从“卡顿”切入，理解JMeter性能测试的复杂性如果你刚接触JMeter，或者已经用它做过一些简单的接口测试，那么大概率会遇到一个让人头疼的问题： 为什么我的JMeter一打开就特别卡？ 这几乎是每个…

如何用ROFL-Player完整管理英雄联盟回放文件：免费开源解决方案终极指南

如何用ROFL-Player完整管理英雄联盟回放文件：免费开源解决方案终极指南

2026/6/30 13:57:13

如何用ROFL-Player完整管理英雄联盟回放文件：免费开源解决方案终极指南【免费下载链接】ROFL-Player (No longer supported) One stop shop utility for viewing League of Legends replays! 项目地址: https://gitcode.com/gh_mirrors/ro/ROFL-Player 还在…

Windows系统文件abcCertFirm.dll丢失找不到问题解决

Windows系统文件abcCertFirm.dll丢失找不到问题解决

2026/6/30 16:57:56

在使用电脑系统时经常会出现丢失找不到某些文件的情况，由于很多常用软件都是采用 Microsoft Visual Studio 编写的，所以这类软件的运行需要依赖微软Visual C运行库，比如像 QQ、迅雷、Adobe 软件等等，如果没有安装VC运行库或者安装…

智慧教育平台电子课本下载工具：让教学资源触手可及

智慧教育平台电子课本下载工具：让教学资源触手可及

2026/6/30 16:57:56

智慧教育平台电子课本下载工具：让教学资源触手可及【免费下载链接】tchMaterial-parser 国家中小学智慧教育平台电子课本下载工具，帮助您从智慧教育平台中获取电子课本的 PDF 文件网址并进行下载，让您更方便地获取课本内容。项目地址: h…

css中实现三角形的一些方法

2026/6/30 16:57:56

一、border 边框法（最经典、兼容性最佳） CSS 盒模型中，元素边框的交界处并非直线衔接，而是呈斜向分割的形态。当元素的width与height均设置为 0 时，元素的可视区域完全由四条边框构成，四条边框会各自形成一…

08 一文讲清楚memory，claude.md与skill

08 一文讲清楚memory，claude.md与skill

2026/6/30 16:57:56

1. 问题： Agent 面临两大核心困境： 进程级失忆：Agent 的记忆仅存于会话内存中，进程重启后一切归零，跨会话需重新认知。有损压缩不可逆：受限于上下文窗口，历史对话必须被压缩，但压缩会…

别再手动提取序列了！用gffread 0.12.7一键搞定转录本、CDS和蛋白序列（附完整命令）

别再手动提取序列了！用gffread 0.12.7一键搞定转录本、CDS和蛋白序列（附完整命令）

2026/6/30 16:57:56

生物信息学实战：用gffread高效提取转录本、CDS与蛋白序列在基因组数据分析中，我们经常需要从注释文件中提取特定类型的序列。传统的手动提取方法不仅耗时耗力，还容易出错。今天要介绍的gffread工具，正是为解决这一痛点而生。作为一…

保姆级教程：用R语言mediation包搞定NHANES数据的中介效应分析（附完整代码）

保姆级教程：用R语言mediation包搞定NHANES数据的中介效应分析（附完整代码）

2026/6/30 16:47:50

零基础掌握NHANES数据中介分析：R语言mediation包全流程实战第一次接触NHANES数据的中介效应分析时，我被复杂的抽样设计和权重处理搞得晕头转向。记得当时为了赶一篇关于环境暴露与健康结局的论文，连续三天卡在R报错上——直到发现mediation包…

Python QQ机器人完整指南：5分钟搭建智能消息助手

Python QQ机器人完整指南：5分钟搭建智能消息助手

2026/6/30 0:05:49

Python QQ机器人完整指南：5分钟搭建智能消息助手【免费下载链接】qqbot QQBot: A conversation robot base on Tencents SmartQQ 项目地址: https://gitcode.com/gh_mirrors/qq/qqbot 你是否想要一个能自动回复消息、定时提醒任务的智能QQ机器人&#xff1f…

SQLMap高级用法：--data与--method参数实战非标准POST请求注入

SQLMap高级用法：--data与--method参数实战非标准POST请求注入

2026/6/30 0:05:49

1. 项目概述：当SQLMap遇上“非标准”POST请求在渗透测试或者安全研究的过程中，我们经常会遇到一些“不听话”的Web应用。它们不像教科书里的例子那样，规规矩矩地用application/x-www-form-urlencoded格式发送POST请求。你可能会遇到用JSON传参…

API安全实战：从三层滤网防御到系统化加固指南

API安全实战：从三层滤网防御到系统化加固指南

2026/6/30 0:05:49

1. 项目概述：为什么API安全不再是“选修课”最近在跟几个做后端开发的朋友聊天，发现一个挺有意思的现象：大家现在对数据库安全、服务器防火墙配置都挺上心的，各种加密、审计、监控手段齐上阵，但一聊到API接口&#xff…

管理者的六个层次

2026/6/29 5:22:49

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

2026/6/29 13:45:10

6个月前的2025年12月，Boris Cherny 公开宣布自己卸载了 IDE。一时间，Vibe Coding 成了全行业最热的话题。6个月后，当我们回过头来拉一份真实账本，发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

审计来了，数据权限全开——审计走了，怎么确保权限全部关掉？

审计来了，数据权限全开——审计走了，怎么确保权限全部关掉？

2026/6/29 1:56:38

引言：审计结束三个月了，审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间，内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中，审计…