Red de Respuestas Legales - Directorio de abogados - ¿Qué tamaño tiene el mercado nacional actual de etiquetas de datos?

¿Qué tamaño tiene el mercado nacional actual de etiquetas de datos?

La anotación de datos se refiere al proceso de clasificar, enmarcar, anotar, etiquetar y otros procesos de datos como imágenes, sonidos y textos, y etiquetar las características de los objetos como materiales básicos para el aprendizaje automático. Según el método de participación, las empresas participantes en la industria del etiquetado de datos de China se dividen principalmente en crowdsourcing y fábricas de construcción propia. Entre ellos, el crowdsourcing incluye principalmente el crowdsourcing de Baidu, el crowdsourcing de JD.COM y los datos de Totoro. Los modelos de fábrica incluyen principalmente Beixi, Yunchai, Aishu Intelligence, Haitian Shengrui, Alibaba Data Annotation, Yuan Kun Intelligent Data, Dianwo Technology, etc.

Las empresas líderes crean sus propios equipos de datos, y los proveedores de datos pequeños y medianos representan una gran proporción.

En la actualidad, el primer escalón del mercado nacional de anotación de datos de China incluye empresas líderes que han establecido sus propios departamentos de anotación de datos, entre ellas JD.COM (JD.COM Zhongzhi), Baidu (Baidu Zhongce), Tencent, y Alibaba (Alibaba) tienen sus propias plataformas y herramientas de anotación. Además de las empresas líderes, en los últimos años han surgido en China muchas empresas de etiquetado de datos, como Totoro Data, Testin Cloud Testing, Besay BasicFinder, Data Hall, etc. Estas empresas ocupan el segundo lugar después de las empresas líderes, tienen una escala considerable y se encuentran en el segundo escalón.

Entre los participantes de la industria de etiquetado de datos de China, divididos por escala, los proveedores de servicios de datos de marca, los proveedores de datos pequeños y medianos y los equipos de datos básicos autoconstruidos del lado de la demanda forman una relación de competencia en el mercado y son los principales proveedores del mercado de etiquetado de datos de IA, que representan el 30,4%, 47,0% y 22,6% respectivamente en 2019. Actualmente, los pequeños y medianos proveedores de datos son los principales actores del mercado.

Según el modelo, se divide en empresas de etiquetado de datos y plataformas de crowdsourcing, con una amplia gama de servicios.

Según el método de participación, las empresas participantes en la industria de etiquetado de datos de China se dividen principalmente en plataformas de crowdsourcing y fábricas autoconstruidas (empresas de etiquetado de datos profesionales). En el ranking de empresas de etiquetado de datos en 2020, Testin Cloud Test, Datatang y Datatang se ubicaron entre los tres primeros; en el ranking de plataformas de crowdsourcing de etiquetado de datos, JD.COM Zhongzhi, Baidu Zhongce y Datatang se ubicaron entre los tres primeros.

A juzgar por el diseño comercial de las empresas representativas de anotación de datos, la mayoría de los proveedores de servicios de anotación de datos proporcionan varios tipos de anotaciones de datos, como texto, voz, imágenes, videos, etc., y sus campos de aplicación de servicios cubren seguridad, Conducción inteligente. En muchos campos, como la atención médica, la educación y las finanzas, los principales clientes incluyen empresas de tecnología, empresas de inteligencia artificial, empresas tradicionales, departamentos gubernamentales, instituciones de investigación científica, etc.

La mayoría de las empresas que se centran en el negocio visual construyen sus propias bases de etiquetado, ubicadas principalmente en Shanxi, Henan y otros lugares.

Los datos de IA muestran que, según la dirección del negocio y el momento de entrada al mercado, los actores de la industria se pueden dividir aproximadamente en actores iniciales, actores intermedios y tardíos, actores centrados en servicios visuales y actores. centrándose en los servicios de voz. Entre ellos, los jugadores que se centran más en datos de voz generalmente tienen más conjuntos de datos con sus propios derechos de propiedad intelectual; aquellos que tienen bases de etiquetado autoconstruidas o equipos de etiquetado de tiempo completo son en su mayoría jugadores visuales.

Como parte indispensable de la cadena de la industria de la inteligencia artificial, el desarrollo de servicios de anotación de datos de IA se ha convertido en una de las direcciones importantes para promover la construcción de IA en varios lugares. Guizhou, Shanxi, Chongqing y otros lugares han emitido sucesivamente directrices para introducir empresas de tecnología, construir bases de datos y centros de comercio de datos y crear parques industriales de inteligencia artificial con características locales.

Actualmente, muchas empresas de anotación de datos han creado sus propias bases o equipos de anotación, como la base de anotación de datos de IA de Baidu en Shanxi, la base Bainiaohe de Baidu Big Data, la base de procesamiento de datos Baoding de Data Hall y Hefei Data de Data Hall. Las bases, salas de datos, centros de registro TTS de Beijing, etc. se encuentran principalmente en Shanxi, Henan y otros lugares.

Beijing, Shanghai y Chengdu son las tres empresas con mayor demanda, y el número en Hangzhou ha disminuido.

Desde la perspectiva de las empresas de demanda, según las estadísticas de etiquetado de datos de IA, en abril de 2020, el número de empresas nacionales de etiquetado de datos era 565, y en febrero de 2020, el número aumentó a 705. A juzgar por la distribución regional de las empresas etiquetadas con datos, a finales de 2020, 65438+2 meses, Beijing, Shanghai, Chengdu, Shenzhen y Hangzhou eran las 5 ciudades TOP, con un número de empresas que llegaban a 185, 84, 68, 63 y 46 respectivamente. Entre ellas, el número de empresas en Beijing, Shanghai, Chengdu y Shenzhen aumentó en comparación con abril de 2020, mientras que el número de empresas en Hangzhou disminuyó en comparación con abril de 2020.

La concentración del mercado es baja y mejorará en el futuro, y las fusiones y adquisiciones industriales se convertirán en una tendencia.

En 2019, la CR5 (participación de mercado de las cinco principales empresas) de la industria del etiquetado de datos de IA fue del 26,2%. Se encuentra en una etapa de competencia de baja concentración. Buen espacio de desarrollo. Entre las cinco empresas principales, el crowdsourcing de datos de Haitian Risheng y Baidu se están volviendo cada vez más populares. Se entiende que entre los proveedores nacionales en general, la mayoría de las empresas brindan servicios de muestreo de datos de imágenes, que incluyen datos de retratos, datos de OCR, datos de conducción autónoma, etc. Las necesidades empresariales están dispersas y el crowdsourcing de datos de Baidu representa la mayor parte de los ingresos.

En comparación, la demanda de datos de voz está relativamente concentrada y el umbral de oferta es más alto que el de los datos de imágenes. El contenido incluye datos de reconocimiento de voz, datos de síntesis de voz, etc. , entre los cuales el haitiano Shengrui tiene la mayor participación en los ingresos.

La concentración actual de la industria del etiquetado de datos de inteligencia artificial es moderada y no es un mercado oligopólico ni plenamente competitivo. Por un lado, Baidu Data Crowdsourcing, Haitian Shengrui, Datatang y otras empresas ingresaron al mercado antes y acumularon más recursos de clientes. Por otro lado, debido a que las empresas transformadoras anteriormente utilizaban conjuntos de datos públicos para entrenar modelos, el requisito de una alta precisión de los datos aún es de corta duración. Debido a la histéresis del efecto de transmisión ecológica, el umbral del mercado no es obvio. Las pequeñas y medianas empresas con capital débil y capacidad de I+D todavía tienen un gran potencial de desarrollo.

Sin embargo, con el desarrollo de las empresas downstream en el futuro, el uso directo de equipos subcontratados tendrá costos bajos y una gran seguridad y controlabilidad de los datos. Algunas necesidades básicas serán autosuficientes para las empresas transformadoras y el mercado de valores existente de proveedores de servicios de datos externos enfrentará una disminución. Por lo tanto, deberán emprender tareas únicas, difíciles y de vanguardia, que les exigirán invertir en investigación y desarrollo. de herramientas de procesamiento de datos profesionales y de alta precisión. Investigación básica sobre algoritmos de inteligencia artificial para captar las necesidades de los clientes y desarrollar mercados incrementales. Por lo tanto, la fortaleza del capital y de la I+D se ha convertido en un umbral industrial más alto. Al mismo tiempo, debido al enfriamiento del mercado de capitales en los últimos años, varios pequeños y medianos fabricantes se enfrentan a una contracción empresarial. Además, algunos fabricantes han comenzado a realizar fusiones y adquisiciones dentro de la industria. Con referencia al desarrollo del mercado de servicios de datos en el extranjero (el gigante de la industria extranjera Appeng ha adquirido otras empresas muchas veces), las fusiones y adquisiciones también se convertirán en una tendencia del mercado. Bajo la influencia de múltiples factores, la concentración industrial aumentará.

En resumen, las fusiones y reorganizaciones en la industria del etiquetado de datos se convertirán en la tendencia general en el futuro. Un evento típico de fusiones y adquisiciones en China en la actualidad es que Bisai BasicFinder ha adquirido un grupo de proveedores profesionales de servicios de anotación manual para enriquecer los sistemas independientes de recopilación de datos y completar tareas más diversas. El ritmo de las fusiones y reorganizaciones en la industria global del etiquetado de datos se está acelerando.

Por un lado, las empresas líderes están adquiriendo gradualmente plataformas de datos pequeñas, medianas y micro, elevando su poder de negociación a un nuevo nivel. En este contexto, la concentración del mercado de la industria mundial del etiquetado de datos ha aumentado aún más. La escala de fusiones y adquisiciones en la industria del etiquetado de datos seguirá creciendo y la competencia en la industria será cada vez más feroz.

——Para obtener más datos, consulte el "Informe de análisis de planificación estratégica de inversiones y pronóstico del mercado de la industria de etiquetas de datos de China" del Instituto de Investigación Industrial Qianzhan.