Red de Respuestas Legales - Derecho de patentes - El campo técnico del análisis y procesamiento de características del texto.

El campo técnico del análisis y procesamiento de características del texto.

Los escenarios de aplicación son los siguientes:

1. Seguro de propiedad: puede completar automáticamente el formulario de solicitud de seguro, el formulario de solicitud de reclamo, el certificado médico y la revisión del contrato.

2. Gran salud: materiales de divulgación de relaciones públicas, revisión de prescripciones de enfermedades, artículos médicos y extracción de información clave de instrucciones de medicamentos.

3. Retail: comparación de descripciones de productos, corrección de errores de embalaje de productos; extracción de información de documentos de transporte.

4. Fabricación: Facturación, órdenes de compra y venta, órdenes de logística de transporte y revisión de contratos.

Tecnología clave:

Utiliza un modelo de espacio vectorial para describir texto. Convierta texto no estructurado en texto estructurado.

¿Por qué no utilizar estadísticas de frecuencia de palabras y algoritmos de segmentación de palabras? Debido a que las dimensiones de los vectores de características obtenidos por estos dos métodos son muy grandes y el costo del procesamiento tardío del vector también es muy alto, no favorece la clasificación y agrupación posteriores.

El método principal es utilizar palabras destacadas para representar texto. Las palabras destacadas deben cumplir los siguientes requisitos: pueden identificar el contenido del texto y distinguir otros textos. No deben ser demasiadas y son fáciles de identificar. implementar.

Una vez seleccionadas las palabras destacadas, deben tener el peso correspondiente para expresar diferentes influencias y es mejor ordenarlas.