随着深度学习和人工智能的广泛应用,数据的规模逐渐增加,数据场景的复杂度也在不断加码。传统的人工标注既耗时又易出错,往往不可行或者效果不理想。这些问题制约着AI技术的落地应用。
当前大模型应用热潮兴起,具备AI自动标注能力的预训练大模型为解决上述问题提供了一条现实可行的技术路径,为推动AI技术的大规模落地和应用提供强有力的支持。
立足自动化标注的发展趋势和行业痛点,标贝科技已经对自研的AI数据平台系统进行全面升级,在全栈数据标注场景式中搭载了大模型预标注和自动化标注能力,并应用于3D点云、2D图像、音频、文本等数据场景的大规模、复杂任务和常规任务的标注中。在保证有效处理的前提下,确保标注结果的高准确率,相对纯人工标注效率可提升70%以上,为用户提供更性价比的数据方案和服务。
本期先为各位介绍标贝科技大模型预标注和自动化标注能力在OCR图片标注场景的应用价值。
OCR(Optical Character Recognition),光学字符识别,指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,其本质就是利用光学设备去捕获图像并识别文字,最终将图片中的文字转换为可编辑和可搜索的文本。
OCR识别在生活中随处可见,例如财税票据识别、身份证件识别、文档文字识别等,有效帮助企业和个人用户减少手动输入的繁琐,提升工作效率。在AI技术广泛应用之前,OCR技术标注数据集是一项比较繁琐和流程较为复杂的工作,整个过程需要经过较多步骤的手动标注和校验,才能够实现高精度的文本检测和识别。
特别是实际应用中,OCR图片存在数据种类繁多、字体内容生僻、拍摄角度多样、图片干扰信息繁多、内容冗长等问题,传统的人工手动标注容易受人为主观因素影响,出现标注错误或不准确。
面对这一现状,标贝科技2D图像标注平台基于大模型自动化标注能力,可以支持对类型OCR图片自动进行预处理,自动识别图像中的文字区域和内容,人工只需要在预识别的基础上,进行少量微调,就可以完成高质量的OCR图片标注,极大的提升标注效率和准确性,降低人工成本。
例如,在具体的OCR小票标注场景下,遇到小票票面有模糊、污渍、折痕等,或者由于拍摄角度和光照条件等因素,导致图像质量下降。手工标注不仅需要大量时间和人力,而且对于标注人员的观察力和判断力要求较高。
01 数据预处理:标贝科技采用图片清洗算法对小票图片进行自动预处理,包括自动纠正拍摄角度、去噪、二值化、分割等操作,消除小票上的干扰因素,并提取出文字区域。
02 特征提取:其次再通过深度学习技术,自动学习和提取文字区域的特征,识别出不同的文字和符号,减少手动调整和优化的工作量。
03 自动分类和识别:最后利用OCR+定位模型算法对小票进行标注和转写,将识别出的文字内容,进行大模型数据理解,进行自动分类,标注出文字属于的类别是商品、价格、还是编号等。
总之,通过标贝科技大模型预标注和自动化标注,可以大大减少手动标注OCR图片的工作量,同时自动化标注还可以减少人为因素导致的标注错误,显著提高OCR技术的精度,为OCR识别在各个场景应用提供更加便捷有效的文字识别解决方案。
目前,标贝科技大模型预标注能力可以支持手写体、印刷体、多语言的OCR图片标注,并应用于多样性和复杂性的场景,实现数据预处理、数据标注、模型训练等全流程的自动化。通过对大量OCR图片数据的自动分析和标注,训练出一个更加比较准确的OCR模型。此外,我们还可以根据不同的场景和需求,通过微调大模型,快速地定制和扩展标注工具,提升模型的场景化预识别能力,满足不同场景下的标注需求。
特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。
腾讯云618狂欢节特惠来袭!现在购买3年轻量云服务器,配置2核2G4M,只需396元!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
据百度官方介绍,位于海口市秀英区的百度智能云人工智能基础数据产业基地日前启动运营,这是百度智能云与海口市政府合作共建的国内首个大模型数据标注中心。大模型正处在产业落地前期,高质量的数据,是大模型实现产业化的关键要素。百度智能云方面表示,目前已经在全国与各地政府合作,共建了十多个数据标注基地,累计为当地提供超过1.1万个稳定就业岗位,间
微信发布《关于规范“自媒体”创作者内容标注的公告》称,为进一步规范“自媒体”创作行为,加强对不实信息的治理,根据《关于加强“自媒体”管理的通知》要求,“自媒体”创作者应主动对发布内容进行规范标注。《通知》要求:“自媒体”在发布涉及国内外时事、公共政策、社会事件等相关信息时,网站平台应当要求其准确标注信息来源,发布时在显著位置展示。公众号登录微信公众平台-选择创作来源-选择标识类型,当创作者勾选其中一个信息来源标识类型后,添加的标识将在文章显著位置展示。
百度智能云与海口市政府合作共建国内首个大模型数据标注基地,位于海口市秀英区,未来会为各行各业提供大模型数据服务。大模型正处在产业落地前期,高质量的数据,是大模型实现产业化的关键要素。百度智能云在全国已与各地政府合作共建十余个数据标注基地,累计为各区域提供超过11000个稳定就业岗位,间接带动50000人就业,培育数万名AI数据人才,吸引孵化优质企业超200家。
Roboflow推理服务器是一个易于使用的、面向生产环境的推理服务器,支持多种流行的计算机视觉模型架构和微调后的模型部署。它可以在各种设备和环境上部署,无需机器学习的先验知识。它是一个部署和管理视觉AI模型非常方便的工具。
似乎自ChatGPT进入大众视野起,需要依靠人工进行数据标注,就成为人们对大语言模型根深蒂固的印象之一。从两个以上大模型针对同一个问题给出的不同回答里,找到当中的语病、逻辑和事实错误,标记不同的错误类型,再对这些回答按照质量分别进行打分等,这些都是大模型数据标注员要干的事情。人工标注对于泛化仍然极其重要RLHFRLAIF混合方法比任何单一方法都要好。
2023年的中概股没有什么新闻——全球科技行业的C位被AI大模型抢走了,北美的几家科技巨头风光无限,投资者纷纷传诵着英伟达的高端GPU如何不可替代、微软的OfficeCopilot如何打开了生成式AI的商业化道路,以及苹果、亚马逊如何在自身的核心产品当中应用AI大模型。这场大戏十分风光,可惜风光都是别人的,与中概股科技公司无关。我迫不及待地看到这一切成为现实的那一天!
getimg.ai是一款非常实用的人工智能工具,可以帮助用户生成高质量的AI绘画作品、修改照片、扩展图片,并且还提供了自定义AI模型的功能。免费用户每月可享受100张使用额度,使用方便快捷。每个模型都存储在getimg.ai平台上,几秒钟后即可使用。
华为Mate60Pro包装盒上写的是卫星移动终端,并不是数字移动电话机。有网友表示不讲武德”。之前的华为Mate50系列支持卫星通信,这次Mate60Pro支持卫星通话,遥遥领先手机行业。
【新智元导读】谷歌团队认为,模型泛化能力无处不在,只要摸清条件,模型就不是随机鹦鹉。在特定情况下,人工智能模型会超越训练数据进行泛化。且本文中这种机制化的可解释性方法可能有助于识别模式,从使神经网络所学算法的研究变得容易,甚至有自动化的潜力。
根据《生成式人工智能服务管理暂行办法》的要求,信安标委发布了《网络安全标准实践指南——生成式人工智能服务内容标识方法》。该指南给出了针对文本、图片、音频和视频四类生成内容的标识方法,旨在指导生成式人工智能服务提供者提高安全管理水平。由自然人提供服务转为由人工智能提供服务,容易引起使用者混诸时,应通过提示文字或提示语音的方式进行标识
核心频率不同,CPU型号不同天玑9200+和天玑 9000 都是联发科的5G旗舰级芯片,天玑9200+和天玑9000都是采用台积电4nm工艺制程。天玑9200+的CPU最高主频为3.3GHz,而天玑 9000 的CPU最高主频为3.2GHz。两款芯片都支持双模5G、WiFi 6E和蓝牙5. 2 等技术。
天玑9200+主频是3.0GHz,与骁龙 8Gen 2 相同,跑分要比骁龙 8Gen 2高一点点天玑 9200+ 处理器与天玑 9200 同架构,但所有核心频率增加,主频来到了 3.0GHz,与骁龙 8Gen 2 相同。跑分数据,天玑 9200+ 在 Geekbench v6 平台单核得分 2121 分,多核得分 5655 分。作为对比,骁龙 8Gen 2 的单核跑分成绩在大约 2000,多核成绩大约 5400。天玑9200+的安兔兔跑分大约为 136 万分,骁龙8Gen2 安兔兔跑分大约是128万分。
在 Geekbench v6 平台单核得分 2121 分,多核得分 5655 分联发科已经正式官宣,天玑9200+将于 5 月 10 日发布,这款处理器的 Geekbench v6 跑分已经出现。天玑 9200+ 处理器与天玑 9200 同架构,但所有核心频率增加,主频来到了 3.0GHz,与骁龙 8Gen 2 相同。 根据爆料的跑分数据,天玑9200+在 Geekbench v6 平台单核得分 2121 分,多核得分 5655 分。 作为对比,骁龙 8Gen 2 的单核跑分成绩在大约 2000,多核成绩大约 5400。
7天以上小米手环 8 搭载蓝牙 5.1,内置直流 3.87V 聚合物锂离子电池,型号为 M2239B1。上一代的小米手环 7 续航大约有9-15天左右。 小米手环 7 内置180mAh 电池。预计小米手环8的续航会比小米手环7续航略微提升一点。
2K+ 分辨率魅族 20 Pro 采用6.81英寸直屏,2K+ 分辨率、100% P3 广色域、120Hz LTPO 高刷、最高 1200 nit 全屏亮度、最低 2 nit 全屏亮度,同时支持防蓝光、DC 调光等功能一应俱全;魅族 20 Pro采用旗舰级性能配置,包括顶级处理器第二代骁龙 8、12GB 起步的 LPPDR5X 大内存、至高 512GB UFS4.0 极速闪存以及 36424 平方毫米的立体散热堆叠。
第二代骁龙 8,LPPDR5X+UFS4.0,2K三星E6 材质Super AMOLED屏幕魅族 20 Pro,内置第二代骁龙 8,LPPDR5X+UFS4.0,搭载了2K三星E6 材质Super AMOLED屏幕,屏幕尺寸6. 81 英寸,支持120Hz自适应屏幕刷新率和1500Hz瞬时触控采样率,峰值亮度可达1800nit,屏幕还通过了SGS抗蓝光、抗频闪护眼认证;破晓灰、曙光银、朝阳金三种配色,整机厚7. 8 毫米,重 209 克;镜头模组由 5000 万像素人像镜头、 5000 万像素广角镜头、 5000 万像素超广角镜头组成,支持全像素对焦技术搭配dTOF辅助对焦,官方称将使对焦速度提升33%。魅族20 系列的主摄均支持SMA防抖,最高8K视频录制和夜景录像功能;5000mAh电池配80W快充,支持50W无线GB三种存储组合,售价 3999 起。
后置三摄,主摄 5000万像素,屏幕分辨率2496*2224华为Mate X3有「羽砂玻璃版:羽砂白、羽砂黑、羽砂紫」、「素皮版:晨曦金、青山黛」五款配色可选;覆盖昆仑玻璃;超轻薄折叠四曲设计,机身重量仅239g,厚度仅5.3mm, IPX8级抗水。屏幕拥有2496*2224超高分辨率和426ppi 超高像素密度。同样支持最高120Hz 自适应刷新率以及1440Hz PWM 调光。影像方面:搭载5000万像素超感知主摄,1300万像素超广角镜头,1200万像素潜望式长焦镜头。并配备10通道多谱传感器和激光对焦传感器,支持100倍变焦和5倍光学变焦。续航方面:配备4800mAh 大电池,支持50W 无线W 有线W 无线反向快充。性能方面:与华为 P60系列一样搭载了骁龙8+ 处理器,配备了超冷跨轴石墨烯散热系统,导热面积提升了20%。价格:华为Mate X3:256GB:12999、512GB:13999;华为 Mate X3典藏版:1TB:15999
6. 67 英寸的OLED屏幕, 4800 万像素长焦镜头华为P60 系列在背部采用了矩阵型模组,官方称之为“凝光设计”,引入了“凝光贝母”工艺;华为P60 全系搭载了6. 67 英寸的OLED屏幕,拥有2700* 1220 刷新率,显示效果十分细腻,支持10. 7 亿色、1440Hz PWM调光。 同时支持全局色彩管理,支持莱茵专业色准双重认证;屏幕还支持LTPO动态高刷新率,支持1~120Hz自适应刷新率,还配备了昆仑玻璃面板,IP68 防尘抗水;相机方面,华为P60 Pro则进一步升级长焦镜头,配备了 4800 万像素RYYB的超聚光夜视长焦镜头,支持3. 5 倍光学变焦、OIS,拥有F2. 1 超大光圈;支持双向北斗卫星通信;5100 毫安时大电池+88W快充;首发搭载了全新的鸿蒙3.1,新增了AOD息屏显示功能。
6.67英寸的OLED屏幕,支持1~120Hz的LTPO刷新率华为P60 系列的屏幕搭载了骁龙8+ 4G处理器,6. 67 英寸的OLED屏幕,支持1~120Hz的LTPO刷新率,支持1440Hz PWM调光,拥有10. 7 亿色、全局P3 色域、HDR-P3HDR Vivid显示效果;覆盖四曲昆仑玻璃,支持IP68 防水,是全球首款德国莱茵专业色准双重认证的手机;相机方面,华为P60 支持F1.4-4. 0 十档可变光圈,搭载大光圈高透光镜群和RYYB超感光传感器,支持了华为XD Fusion Pro质感引擎;支持双向北斗卫星消息;首发搭载鸿蒙3.1,支持AOD息屏显示;价格,华为P60 的128GB版 4488 元,256GB版本是 4988 元,512GB版本是 5988 元。
天玑9000芯片,LPDDR5+UFS3.1,11.61英寸LCD屏幕,支持144Hz刷新率OPPO Pad2主要配置包括:11.61英寸7:5比例LCD显示屏,拥有2800×2200分辨率和500尼特亮度,支持144Hz五档刷新率智能调节,2048级亮度自适应智能调光并支持手写笔。OPPO Pad2基于联发科技天玑9000,辅以LPDDR5内存和UFS3.1存储,内置9510毫安时电池、67W有线万像素前置摄像头和蓝牙5.3。软件方面,ColorOS13.1支持5G通信共享。可以自动共享手机的5G通信,从而直接上网、接打电话、同步手机验证码、拍照流转和应用接力。
5G双待双通(DSDS)、WiFi 6/6E、蓝牙5.3等骁龙7+ Gen2 采用了骁龙X62 5G调制解调器,在全球范围内支持多种频段和模式的5G网络连接。它还是首款在骁龙 7 系中实现了5G双待双通(DSDS)功能,在两张SIM卡都插入时可以同时使用两个不同运营商或不同网络制式(例如SA和NSA)的5G网络服务。除此之外,它还支持WiFi 6/6E和蓝牙5. 3 等无线技术。