百度easydl数据标注

2 篇文章 0 订阅
订阅专栏

一/ 百度easydl数据标注 脚本

1 官方标注工具,链接如下,由lableme改进而形成

GitHub - Baidu-AIP/Easyyibiao

2 官网数据导入格式三种分别为:

布局如图所示

 2.1json 通用格式 .json

{"labels": [{"y1": 579, "x2": 466, "x1": 328, "y2": 718, "name": "other","meta":{"points":[{"y": 718,"x": 400},{"y": 626,"x": 328},{"y": 579,"x": 393},{"y": 672,"x": 466}]}}]}

2.2 xml ,这个比较好扩展 object节点,复制增加即可

<?xml version="1.0" encoding="utf-8"?>
<annotation>
    <filename>00036.jpg</filename>
    <segmented>0</segmented>
    <owner>
        <name>Lmars, Wuhan University</name>
        <flickrid>I do not know</flickrid>
    </owner>
    <folder>RSDS2016</folder>
    <object>
        <name>other</name>
        <pose>Left</pose>
        <truncated>1</truncated>
        <difficult>0</difficult>
        <quad>
            <x1>400</x1>
            <y1>718</y1>
            <x2>328</x2>
            <y2>626</y2>
            <x3>393</x3>
            <y3>579</y3>
            <x4>466</x4>
            <y4>672</y4>
        </quad>
        <bbox>
            <x1>328</x1>
            <y1>579</y1>
            <x2>466</x2>
            <y2>718</y2>
        </bbox>
    </object>
</annotation>

 2.3 coco json

{"info": {"contributor": "nihao", "data_created": "2021", "version": "1.0", "year": 2021}, "licenses": "licenses", "image_nums": 1, "images": [{"file_name": "00036.jpg", "id": 1, "width": 1024, "height": 768}], "categories": [{"id": 1, "name": "other", "supercategory": "other"}], "annotations": [{"category_id": 1, "bbox":[328, 579, 138, 139],"area": 9430, "segmentation": [[400, 718, 328, 626, 393, 579, 466, 672]], "iscrowd": 0, "image_id": 1, "id": 1, "shape": "quad"}]}

3 接下来,通过程序自动生成xml文件

txt2xml.py

import os
from lxml.etree import Element, SubElement, tostring

def txt_xml(img_name, txt_path, img_xml, xml_path):
    #读取txt的信息
    clas=[]
    imh, imw = 800, 800
    txt_img=os.path.join(txt_path,img_name)
    with open(txt_img,"r") as f:
        for line in f.readlines():
            line = line.strip('\n')
            list = line.split(" ")
            clas.append(list)       # [0, x1, y1, x2, y2]

    node_root = Element('annotation')
    node_folder = SubElement(node_root, 'folder')
    node_folder.text = '1'
    # filename
    node_filename = SubElement(node_root, 'filename')
    node_filename.text = img_name.split(".")[0]+".jpg"
    # path
    node_path = SubElement(node_root, 'path')
    node_path.text = str(txt_img).split('.')[0] + '.jpg'
    # source
    node_source = SubElement(node_root, 'source')
    node_database = SubElement(node_source, 'database')
    node_database.text = 'Unknown'
    # size
    # node_size = SubElement(node_root, 'size')
    # node_width = SubElement(node_size, 'width')
    # node_width.text = str(imw)
    # node_height = SubElement(node_size, 'height')
    # node_height.text = str(imh)
    # node_depth = SubElement(node_size, 'depth')
    # node_depth.text = '3'
    # segmented
    node_segmented = SubElement(node_root, 'segmented')
    node_segmented.text = '0'
    # object
    for i in range(len(clas)):
        node_object = SubElement(node_root, 'object')
        node_name = SubElement(node_object, 'name')
        node_name.text = 'other'
        node_pose=SubElement(node_object, 'pose')
        node_pose.text="Left"
        node_truncated=SubElement(node_object, 'truncated')
        node_truncated.text="1"
        node_difficult = SubElement(node_object, 'difficult')
        node_difficult.text = '0'
        # bndbox
        node_bndbox = SubElement(node_object, 'quad')
        x1 = SubElement(node_bndbox, 'x1')
        x1.text = str(clas[i][1])
        y1 = SubElement(node_bndbox, 'y1')
        y1.text = str(clas[i][2])
        
        x2 = SubElement(node_bndbox, 'x2')
        x2.text = str(clas[i][3])
        y2 = SubElement(node_bndbox, 'y2')
        y2.text = str(clas[i][4])
        x3 = SubElement(node_bndbox, 'x3')
        x3.text = str(clas[i][5])
        y3 = SubElement(node_bndbox, 'y3')
        y3.text = str(clas[i][6])
        x4 = SubElement(node_bndbox, 'x4')
        x4.text = str(clas[i][7])
        y4 = SubElement(node_bndbox, 'y4')
        y4.text = str(clas[i][8])  
    xml = tostring(node_root, pretty_print=True)  # 格式化显示,该换行的换行
    img_newxml = os.path.join(xml_path, img_xml)
    file_object = open(img_newxml, 'wb')
    file_object.write(xml)
    file_object.close()

if __name__ == "__main__":
    #标注文件夹所在位置
    txt_path=r"temp"
    #txt转化成xml格式后存放的文件夹
    xml_path=r"temp1"
    if not os.path.exists(xml_path):
        os.mkdir(xml_path)
    for img_name in os.listdir(txt_path):
        print(img_name)
        img_xml=img_name.split(".")[0]+".xml"
        txt_xml(img_name, txt_path, img_xml, xml_path)

最终效果图

参考  yolo图像检测数据集格式转换:xml 与 txt格式相互转换_uncle_ll的博客-CSDN博客_yolo数据集txt格式

二/ 利用PIL 模块生成相应的图片 字符图片

参考link : https://github.com/mpcabd/python-arabic-reshaper 

https://github.com/MichalBusta/E2E-MLT

效果:

pip install --upgrade arabic-reshaper

conda install -c mpcabd arabic-reshaper

pip install --upgrade arabic-reshaper python-bidi pillow

代码

#产生阿拉伯文图片
import arabic_reshaper

text_to_be_reshaped = '2023 06 14/2022 06 16'
text_to_be_reshaped1='JXG'
text_to_be_reshaped2='14 06 2023/16 06 2022 X21'

reshaped_text = arabic_reshaper.reshape(text_to_be_reshaped)

'''
At this stage the text is reshaped, all letters are in their correct form
based on their surroundings, but if you are going to print the text in a
left-to-right context, which usually happens in libraries/apps that do not
support Arabic and/or right-to-left text rendering, then you need to use
get_display from python-bidi.
Note that this is optional and depends on your usage of the reshaped text.
'''
from bidi.algorithm import get_display
bidi_text = get_display(reshaped_text)

# At this stage the text in bidi_text can be easily rendered in any library
# that doesn't support Arabic and/or right-to-left, so use it as you'd use
# any other string. For example if you're using PIL.ImageDraw.text to draw
# text over an image you'd just use it like this...

from PIL import Image, ImageDraw, ImageFont

# We load Arial since it's a well known font that supports Arabic Unicode
# font = ImageFont.truetype('Arial', 40)
font = ImageFont.truetype('/PaddleOCR/StyleText/fonts/arabic.ttf', 50)
font1= ImageFont.truetype('PaddleOCR/StyleText/fonts/en_standard.ttf',40)
image = Image.new('RGBA', (800, 600), (255,255,255,0))
image_draw = ImageDraw.Draw(image)
image_draw.text((350,10), text_to_be_reshaped1, fill=(255,255,255,200), font=font1)
image_draw.text((10,10), bidi_text, fill=(255,255,255,200), font=font)
image_draw.text((10,70), text_to_be_reshaped2, fill=(255,255,255,200), font=font1)


# image.show()
image.save("temp.png")

赋能三百六十行 百度EasyDL实现一站式定制开发高精度AI模型
百度大脑
08-14 1446
新基建催生AI等新技术在更多行业和细分场景进一步发展和应用,各行各业都迎来智能化转型的风口,如何推动AI全民化?答案是降低技术门槛,让技术方案模块,操作平台交互化,并且能够快速落地验证。百度重磅打造的EasyDL零门槛AI开发平台为此而来。 2020年8月12日,在百度智能云技术创新沙龙上,百度AI技术生态部高级产品经理分享了百度AI助力企业智能化转型的思考,详细介绍了EasyDL在产业赋能中的重要作用:零门槛定制高精度AI模型,让企业智能化转型更高效。 据介绍,EasyDL百度2017年底.
NLP+VS︱深度学习数据集标注工具、图像语料数据库、实验室搜索ing...
热门推荐
素质云笔记
02-07 7万+
~~因为不太会使用opencv、matlab工具,所以在找一些比较简单的工具。 . . 一、NLP标注工具 来源:《构想:中文文本标注工具(附开源文本标注工具列表)》 Chinese-Annotator 来源:https://github.com/crownpku/Chinese-Annotator 能不能构建一个中文文本的标注工具,可以达到以下两个特点: 标注过程背后
百度飞浆OCR半自动标注软件OCRLabel配置【详细
最新发布
lemon.qing@foxmail.com
09-03 1452
②把tools文件下的PaddleOCR-dygraph.zip解压,可以放到你自己的路径下,【我的路径是D:\BaiduNetdiskDownload\PaddleOCR-dygraph\PaddleOCR-dygraph,并以这个路径为例】解压xunlianji,并在标注软件界面选择 文件-》打开目录-》①选择你刚刚解压完的图片所在文件夹路径,②文件-》自动导出标记结果,界面如下,快捷键信息如下【常用快捷键w是新建标注框,d是切换下一张】。有多识别的,需要删掉多识别的内容,并拖动缩小标签框。
飞浆EasyDL半自动标注语义分割及数据导出
weixin_43655132的博客
03-07 4347
写这一篇帖子实在是机缘巧合。导师让我手动标注一些图片,4000多张我寻思着我好歹也是学人工智能的,咋还能干这么不智能的事呢。然后就在CSDN上苦苦寻找了很多半自动标注的方法,说实话,都打不尽如人意,这里面我自己的原因占很大一部分,因为我小白也没用过label-me之类的。找了5,6个项目都不行,后来在一篇帖子深度学习图像-半自动和自动标注工具_u010451780的专栏-CSDN博客_半自动标注工具里面看到了百度开发的飞浆EASYDL平台,非常方便实用,但是前期因为没有开发数据导出功能,所以逼得我不得不自学
EasyDL文本智能标注产品介绍
qq_15821487的博客
04-19 484
介绍 全景图 三驾马车,数据,算法,算力 标注存在的问题 不同人的认知不同 周期长 降本增效 说白了就是用以及标注的数据训练了个模型,然后去预测未标注的 智能标注解决的问题 背后原理,只是增强型的预训练语言模型 ERNIE效果 反馈 使用 可以人工校准 应用场景 新闻分类,根据标题 语义索引的知识问答 实体抽取 夜总会是必然的不准 目前标注完的数据不能下载,训练完的模型也不能下载 ...
百度EasyDL物体检测离线SDK部署Android
x97666的博客
12-01 1873
使用百度AI EasyDL平台训练模型 部署模型到Android端运行实现物体检测
百度EasyDL不可思议创意开发大赛,十万装备等你拿!》
Mr123321456的博客
05-03 397
      业界近年来巨头们前赴后继成立人工智能研究院,希望在版图再次划分前拔得头筹赢在起跑线上;而创业公司亦带着极强的行动力和使命感,接连跳入深度学习的漩涡之中。      为了降低人工智能入门门槛,百度全面开放最领先的图像定制化训练与服务平台EasyDL。只需四个步骤即可快速获得属于自己的图像识别服务,开发者可持续不断训练及优化模型,提高识别准确度。EasyDL具有可即用、更轻快、高精度和强安...
基于百度EasyDL图像分类的通用微信小程序
07-13
百度EasyDL是零门槛AI开发平台,提供从数据采集、标注、清洗到模型训练、部署的一站式AI开发能力。对于各行各业有定制AI需求的企业用户来说,无论您是否具备AI基础,EasyDL设计简约,极易理解,最快5分钟即可上手...
easydl2labelImg:将自己在easydl的数据集下载到本地并转换为labelImg数据
05-19
easydl数据集导出到labelImg工具 数据集导出并没有官方的api,本工具模拟浏览器下载实现,因官方可能调整相关链接及参数,并不能保证以后一定可用 1 将本代码下载到本地 2 正常登录自己的百度账号,进入物体检测数据...
数据标注:视频数据标注案例.pptx
06-03
在使用百度EasyDL平台进行视频数据标注时,首先需要登录平台并在视频分类中选择“目标跟踪”功能,点击【立即使用】按钮进入模型训练页面。这一步骤标志着视频数据标注项目的正式启动。 ##### 3.2 创建数据集 **...
C#easydl定制图片识别.zip
10-03
在本项目"C# easydl定制图片识别.zip"中,我们主要关注的是如何使用C#编程语言来实现基于百度EasyDL的图像识别功能。EasyDL百度提供的一个深度学习平台,它允许开发者无需具备深度学习专业知识,也能快速定制自己...
百度地图类库 添加标注工具
04-29
百度地图的添加标注工具类,对外开放。 允许用户在地图上点击后添加一个点标注,允许用户设定标注的图标样式。 主入口类是MarkerTool, 基于Baidu Map API 1.2。
三步解决NLP数据标注难题,百度大脑EasyDL专业版上线文本智能标注功能
百度大脑
06-16 2085
随着技术的进步,人工智能的发展和应用如火如荼,智能化转型已经成为企业发展的必然趋势。 人工智能技术作为“新基建”提速的重要一环,应用场景已经日趋广泛,比如在传媒领域的智能机器人写作、各类APP的个性化内容推荐以及准确度接近人类的实时翻译工具等。各行业越来越多的应用案例证明,利用AI技术来提高企业的业务效率,是智能经济时代,企业降本增效、提升核心竞争力的必备“秘籍”。 EasyDL是飞桨深度学习平台推出的面向企业打造的零门槛AI开发平台。Eas
百度自动图像标注工具BML使用教程
weixin_42217041的博客
07-30 5708
BML是一款可以用于图像(图像分类、物体检测、图像分割)、文本(文本分类、文本相似度等)、表格(表格预测)样本的在线自动标注工具。网址为: http://ai.baidu.com/bml/app/dataset/list 使用百度账号登录,可以进入BML平台。 1.数据导入 首先创建数据集 根据需要创建合适的数据集类型,这里我选择物体检测功能。 在新生成的数据集中我们导入本地图片 导入方式选择本地导入,导入图片数量有限,可以直接选择导入压缩包 这里以导入图片为例,导入20张图片,点击确认。 2.数据
百度EasyDate线上协同数据标注平台使用
Quinton的博客
03-20 9828
文章目录一、管理员部分1.建立数据集2.建立标注团队3.发布标注任务4.(补充)数据扩增1.标注前扩增2.标注后扩增一、标注员部分1.进入标注2.标注注意1.标注标签格式2.快捷选项3.暂停标注 EasyDate官网 本文以团队线上协同标注RoboMaster装甲板为例子 一、管理员部分 管理员负责建立数据集、建立标注团队、发布标注任务,管理员同时也可以是标注员 1.建立数据集 进入EasyDate官网,选择新建数据集 选择数据类型和标注类型,填写数据集名称 建立完成,导入数据 支持
百度EasyDL快速进行智能标注并在android手机上快速部署app
weixin_50874291的博客
10-30 882
通过这次百度EasyDL的学习以及动手实践,我有以下的 标注方面的好处: 使用百度EasyDL,先对10张照片进行“人”的标注后,启用智能标注,并一键自动完成了其余180多张照片的标注,大大节省了以往人工标注的时间。 训练方面的好处: 只需要在网页上选择超高精度、高精度、高性能等,并选择设备类型,就可以进行训练,不需要去搭建训练环境,而且训练的速度很快,训练完还能收到手机短信,确实很方便。 部署方面的好处: 百度easyedge可以快速的适配不同的通用设备,android/IOS手机,以及软硬一体设备,只需
要让人人能AI的百度EasyDL,现在怎么样了?
量子位
01-22 1581
李林 发自 凹非寺量子位出品 | 公众号 QbitAI“百度非常愿意和全球有梦想的开发者一起,来实现一个理想:Everyone can AI。”2018年7月的百度Cre...
python标注审核_使用Python实现简易的数据标注工具
weixin_39895881的博客
11-28 281
增加工作效率为目的,最近一直在着手构建一个AI ToolBox。这两天,我为其中的预处理工具目录添加了数据标注模块,该数据标注模块包含以下几个demo:一个简单的GUI练习是一个简单的 GUI 练习demo,它展示了python的GUI库Tkinter的最基本使用方法。如果你对Tkinter不熟悉,阅读的代码是很不错的选择,你将了解如何创建一个GUI窗体,如何创建Button,如何关联事件,以及创...
百度easydl代码集成移植到安卓
qq_45280030的博客
09-06 1481
百度easydl集成代码移植到Android
使用百度easyDL获取token与图像分类API示例
这个脚本展示了如何在百度easyDL平台上进行身份验证、获取token,并利用此token发送图片数据进行分类。开发者需要根据实际项目需求替换掉敏感的`client_id`和`client_secret`,同时注意处理JSON数据的解析和结果展示...
写文章

热门文章

  • mask rcnn 将mask 转json数据01 5691
  • 2021年中国智能物联网(AIoT)白皮书 5488
  • 经典网络vgg应用于 图像二分类的训练代码 5336
  • 图像篡改数据集CASIA 1.0分享 001 5046
  • 图像阴影去除 4637

分类专栏

  • c++ 4篇
  • pytorch 4篇
  • easydl 2篇
  • bash 1篇
  • 相机标定
  • ubuntu 2篇
  • ssh 1篇
  • 论文阅读 31篇
  • jetson 1篇
  • python 39篇
  • paper_reading 17篇
  • segnet 3篇
  • 深度摄像头 3篇
  • 人脸识别 2篇
  • 姿态估计 2篇
  • MATLAB 8篇
  • 分类问题 12篇
  • mask制作 6篇

最新评论

  • 图像篡改数据集CASIA 1.0分享 001

    柒 辞: 请问他的mask怎么得

  • Hybrid LSTM and Encoder–Decoder Architecture for Detection of Image Forgeries论文阅读

    夏雨不在低喃: 问题已解决,测试了下自己训练的模型,效果不是很满意,经常误检

  • Hybrid LSTM and Encoder–Decoder Architecture for Detection of Image Forgeries论文阅读

    夏雨不在低喃: 博主你好,时间有点久远了,不知道您还记不记得他有一个图片转hdf5文件的代码,在git上他有提过,但是下载下来后找不到

  • 图像篡改数据集COVERAGE分享 002

    eeeeeating: 请问您所说的100张篡改图像和100张gt在哪里呀,链接里下载下来是一个image文件夹里面有100组原图和篡改图,一个mask里有100组copy、forged、paste图

  • 图像拼接 可下载代码

    m0_67690068: 垂直方向的拼接怎么改啊?

最新文章

  • websocket_flask
  • 卡尔曼滤波本质
  • 算力计算(darknet)
2023年1篇
2022年4篇
2021年38篇
2020年14篇
2019年40篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

深圳坪山网站建设公司资阳襄阳网站运营优化公司做网站建设优化的公司四川网站优化推广服务兰州网站排名优化热线电话三明网络推广竞价托管网站优化天河网站 优化汕头优化网站推广松江区企业官网网站优化案例成功的网站建设及优化携程网站优化房山快速网站优化服务网站 优化依旧易速达龙华网站推广优化怎么做化工网站seo优化服务汕尾网站优化开发江苏网站优化公司排名新乡网站排名优化费用多少香港网站seo优化洛阳百度网站快速排名优化乐安网站优化渠道嘉兴网站优化找哪家长春推荐网站优化与推广怎么提高网站体验优化传统行业网站优化方案福田儿童网站优化哪家好网站路径利于优化网站建设优化就选s火20星吴江外贸型网站优化方案广州网站优化外包公司网站排名优化百灵 鸟优化香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

深圳坪山网站建设公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化