Red de Respuestas Legales - Consulta de información - Reglas de codificación para el método de entrada Microsoft Pinyin

Reglas de codificación para el método de entrada Microsoft Pinyin

El método de entrada Microsoft Pinyin es el método de entrada de codificación de caracteres chinos de tercera generación de China. El trabajo básico sobre el método de entrada chino comenzó en agosto de 1974. Este proyecto también se conoce como "Proyecto 748". Uno de sus principales resultados es la tabla de frecuencia de caracteres chinos, que por primera vez proporciona datos básicos importantes para el procesamiento de información de caracteres chinos. Después del análisis estadístico de las tablas de frecuencia de caracteres chinos y otras tablas de palabras, la Oficina Nacional de Estándares promulgó el primer estándar nacional en el campo del procesamiento de información de caracteres chinos, el "Conjunto básico de codificación de caracteres chinos para el intercambio de información" (GB2312-80). Este es un estándar de gran alcance y que hace época en la historia del procesamiento de información de caracteres chinos en mi país.

En 1981, la Universidad de Wuhan y otros publicaron los resultados estadísticos de la frecuencia de raíces en el conjunto de palabras del "Diccionario Xinhua". Del 65438 al 0984, la Comisión Nacional de Reforma del Carácter y la Universidad de Wuhan anunciaron los resultados del análisis estadístico dinámico de los trazos, componentes y estructuras de los caracteres chinos dentro del alcance de "Cihai".

En 1985, la Comisión Nacional de Reforma del Carácter y la Universidad de Shanxi publicaron los resultados del análisis estadístico de los apellidos humanos.

En 1986, el Instituto de Aeronáutica y Astronáutica de Beijing y la Agencia de Noticias Xinhua utilizaron tecnología informática para publicar nuevas estadísticas sobre la frecuencia de uso y circulación de caracteres chinos basadas en un gran corpus. Universidad Normal de Beijing, Universidad Jiao Tong de Shanghai, Instituto de Idiomas de Beijing, etc. Publicaron respectivamente las estadísticas de frecuencia de uso de palabras chinas modernas basadas en corpus a gran escala. El Instituto de Lenguaje Informático de la Universidad de Pekín también ha establecido una base de datos de atributos de palabras y corpus chinos integral, informativa y conveniente centrada en la gramática china, que ha desempeñado un papel importante en la promoción del desarrollo de la tecnología de entrada de teclado con codificación de caracteres chinos.

Los estándares nacionales relevantes para los sistemas de entrada de teclado de caracteres chinos publicados después de la década de 1990 incluyen GB13000.1 "Caracteres codificados en multioctetos (UCS) para tecnología de la información" y GB18030 "Extensión del conjunto básico de caracteres codificados en caracteres chinos para información". Intercambio de información tecnológica"” y GB18031 “Teclado numérico de tecnología de la información para entrada general de caracteres chinos”. GB15834 "Uso de signos de puntuación" y GB/T18220-2000 "Requisitos generales para la entrada de caracteres chinos en teclados universales de tecnología de la información" se publicarán próximamente. Las especificaciones emitidas por el Comité de Idiomas incluyen GF3001 "Especificación de componentes de caracteres chinos GB13000.1 para procesamiento de información", GF 3002 "Especificación de orden de trazos de caracteres chinos del conjunto de caracteres GB 13000.1", GF3003 "Teclado universal de procesamiento de información".

La siguiente es una introducción del método de entrada de primera generación al método de entrada de Microsoft:

El método de entrada de codificación de caracteres chinos de primera generación

El Sexto Instituto de Ministerio de Industria Electrónica En 1983, se anunció oficialmente CC-DOS, el primer sistema operativo de disco chino, que marcó una época en la historia del procesamiento de información chino. CC-DOS es una extensión y modificación de PC-DOS. En la versión 2.1 de CC-DOS, ampliamente utilizada, existen métodos de entrada simplificados de pinyin, código de prefijo y sufijo, código rápido y código de posicionamiento, que han cubierto los principales tipos de métodos de entrada, incluido el código fonético, el código gráfico, el código fonético y el código numérico. Desempeñó un papel pionero en la popularización de las aplicaciones informáticas en mi país.

El método de entrada más utilizado en aquella época era el Jianpin y la codificación de consonantes iniciales y finales. Jianpin es un código fonético puro que utiliza un método pinyin entre Quanpin y Shuangpin, usando tres o más letras para comprimir vocales. El código de prefijo y sufijo es un código gráfico puro, que contiene 97 partes y se divide en 52 categorías. No hay muchas reglas a seguir en el mapeo de partes a letras del teclado, y la memoria es muy grande al codificar, los prefijos y sufijos solo toman un componente; Para los componentes de deformación que no figuran en la lista, el usuario debe adivinar a qué clave pertenecen. Ninguno de los métodos admite asociaciones o frases y ambos tienen mucho código duplicado. Por lo tanto, al ingresar, las operaciones de seleccionar y pasar páginas son muy frecuentes, y los ojos necesitan escanear constantemente las líneas de aviso para encontrar las palabras requeridas entre muchos códigos repetidos. Es agotador ingresar, la velocidad es muy lenta y. Es imposible realizar la mecanografía táctil.

El código rápido se logra comprimiendo pinyin y codificando, lo que puede dispersar códigos duplicados hasta cierto punto. Debido a que el método de codificación de código rápido no tiene reglas a seguir, nunca se ha aplicado realmente. El código de posición requiere memorizar los códigos numéricos de 6763 caracteres y símbolos chinos para poder ingresarse por completo, por lo que, a excepción de los signos de puntuación que no tenían otro método de entrada en ese momento, básicamente nadie lo usó.

Otro de los primeros métodos de entrada de codificación de caracteres chinos fue el código telegráfico. El código telegráfico es un esquema de código de igual longitud de 4 bits que utiliza palabras de código que van del 0000 al 9999 y que pueden representar 10.000 caracteres (incluidos caracteres, letras y símbolos chinos). Los códigos telegráficos no tienen códigos repetidos, pero la codificación no es regular y difícil de recordar.

Por lo tanto, se trasplantó completamente a la computadora para las necesidades de las personas de los departamentos de correos y telecomunicaciones que ya están familiarizadas con los códigos telegráficos. No tiene ningún significado para las personas comunes que ingresan caracteres chinos.

En 1986, Lenovo Group y Lenovo Hanka lanzaron simultáneamente el entorno de caracteres chinos de Lenovo. Al principio, la gente utilizaba el método de asociación para acelerar la introducción de caracteres chinos. En ese momento no existía ningún método de entrada de frases, por lo que la tecnología de Lenovo era refrescante. El proceso de entrada de caracteres chinos se cambió de la codificación original a -> pasar página -> seleccionar -> contraseña... a codificar -> seleccionar -> seleccionar..., por lo que muchos métodos de entrada utilizaron posteriormente esta tecnología. Sin embargo, de acuerdo con los estándares de la tecnología de entrada de codificación de caracteres chinos moderna, la tecnología de Lenovo todavía tiene dos debilidades fatales. Un inconveniente es que si la palabra que se ingresará más tarde no forma una frase con la palabra ingresada antes, la asociación fallará. Otra debilidad es que la interacción persona-computadora es demasiado frecuente en la selección de Lenovo. Aunque la longitud promedio del código se acorta, la velocidad de entrada real disminuirá.

En resumen, las características del método de entrada de codificación de caracteres chinos de primera generación son: en un entorno DOS, la entrada se realiza en unidades de caracteres individuales y se proporciona una línea de aviso especial en la parte inferior del pantalla para mostrar una gran cantidad de caracteres repetidos. Esto lleva a operaciones de selección y cambio de página frecuentes; use las teclas numéricas para seleccionar palabras repetidas y use ALT+teclas numéricas para seleccionar repetidamente las palabras repetidas que aparecen en la línea de solicitud; la entrada de signos de puntuación de uso extremadamente común requiere el uso de códigos de posicionamiento, lo cual es muy inconveniente. El uso de la tecnología Lenovo mejora la eficiencia de la entrada, pero su efecto es bastante limitado para cambiar entre varios métodos de entrada (incluido el cambio al inglés) a través de la función compuesta; tecla ALT+Fn (F1-F12); admite modos de ancho completo y medio ancho, pero no admite puntuación china, no admite entrada de frases ni frases personalizadas;

El método de entrada de codificación de caracteres chinos de segunda generación

En 1986, Stone Company y Mitsui & Co., Ltd. cooperaron para lanzar la máquina de escribir electrónica china Stone MS-2400, anunciando la era. de la mecanografía electrónica profesional en China. Con el uso generalizado de las máquinas de escribir de cuatro direcciones, el método de entrada Wubi incluido con la máquina de escribir de cuatro direcciones se extendió primero, y luego el método de entrada de dos tonos incluido con la máquina de escribir de cuatro direcciones inventada por Liu Weimin también se usó ampliamente en ese momento. .

La fuente Wubi es la solución de componente de código de fuente pura más típica. En las fuentes Wubi, los componentes suelen denominarse radicales. La fuente Wubi utiliza 130 radicales básicos. Los radicales básicos se dividen en cinco categorías según los trazos, correspondientes a las cinco áreas del teclado universal. Cada categoría se divide en cinco grupos, correspondiendo cada grupo a una letra del teclado. En un carácter chino, la relación entre raíces se puede dividir en cuatro tipos: raíz única, raíz dispersa, raíz conectada y raíz cruzada. Al dividir los caracteres chinos, debemos seguir el principio de "centrarse en la parte grande, teniendo en cuenta la intuición, si se puede conectar o no y si se puede separar o no". La biblioteca de fuentes Wubi divide los caracteres chinos en tres tipos: caracteres chinos de nombre clave, caracteres chinos raíz y caracteres chinos de nombre no clave, y se aplican diferentes reglas de codificación a cada uno. Además, los códigos de brevedad de primer, segundo y tercer nivel para la codificación de palabras se componen de la primera, segunda y tres letras correspondientes al código completo. La fuente Wubi divide las frases en tres tipos: dos caracteres, tres caracteres y varios caracteres. Se codifican dos palabras tomando las dos primeras raíces de cada palabra en orden. Los tres caracteres se codifican tomando la primera raíz de los dos primeros caracteres y las dos primeras raíces del último carácter en orden. Se codifican varios caracteres tomando la primera raíz del primer, segundo, tercer y último carácter en orden.

La fuente Wu Bi tiene reglas de codificación muy complejas a cambio de una menor tasa de repetición en el conjunto de caracteres GB2312-80. Cuando se utilizan códigos de brevedad obligatorios, la tasa de códigos de baja repetición se puede reducir aún más. Coloque el código de frase en el espacio de codificación restante de todas las palabras de código para lograr una codificación de palabras mixtas. Mientras el número de frases incluidas sea pequeño, la posibilidad de duplicación es relativamente pequeña. La fuente general Wubi en sí no tiene la función de crear caracteres. Estas características de la fuente Wu Bi satisfacen exactamente las necesidades de la mecanografía profesional y se han convertido en una de las razones importantes de su popularidad en la era de la mecanografía profesional.

Aunque la fuente Wu Bi ha logrado un gran éxito en el mercado, sus problemas no pueden ignorarse. En primer lugar, la fuente Wu Bi es difícil de aprender y fácil de olvidar. Además de las complejas reglas de codificación, también tiene muchas excepciones que recordar. Es muy común que los mecanógrafos de Wubi se queden atascados en algunos caracteres comunes al escribir. En este momento, debe cambiar temporalmente al método de entrada Pinyin. En segundo lugar, la fuente Wubi tiene poca escalabilidad. Cuando el conjunto de caracteres pasa de GB2312-80 a GBK y GB18030, cuando aumenta el número de frases, los bits de código de fuente Wubi con una longitud de código de 4 tendrán una gran cantidad de códigos repetidos, lo que le hará perder la ventaja de un código poco repetido. tasa. Las fuentes Wubi adoptan una estrategia de colocación automática en pantalla de cuatro códigos, sin códigos duplicados.

El aumento en la duplicación de 4 dígitos obligó a los mecanógrafos a apartar la mirada del manuscrito para confirmar su entrada, lo que ralentizó la velocidad de entrada. Finalmente, la debilidad más fatal de la fuente Wu Bi es su pobre estandarización. Zhang Xiaocun y otros criticaron ferozmente esto: "La fuente Wu Bi viola las normas del lenguaje y la escritura. Hay una gran arbitrariedad en la división de los caracteres chinos, lo que tiene un impacto negativo en la calidad cultural básica de la gente. Tiene la efecto de estandarizar la educación de los caracteres chinos El impacto es directamente proporcional a la expansión de su rango de aplicación [20] ”

El método de entrada de dos tonos es un ingenioso código de tonos puros [23][25]. La característica más importante del método de entrada de dos tonos es "definir palabras con palabras y asociación inversa" para aliviar el problema de la repetición excesiva de palabras individuales en el modo de código fonético puro. Debido a que hay una gran cantidad de dos caracteres, generalmente puede encontrar uno o dos caracteres, y el primer carácter es el carácter que desea ingresar. Si estas dos palabras están en la primera posición candidata de la línea del mensaje, puede omitir la tecla de selección; de lo contrario, deberá utilizar las teclas numéricas para seleccionar. Si necesita los dos caracteres completos, puede agregar una tecla de espacio para ingresar el segundo carácter. En otras palabras, si se utiliza Shuangpin y se utiliza la tecnología de "definir palabras por palabras", el número promedio de pulsaciones de teclas puede llegar a 2,5 al ingresar palabras de uso común, básicamente evitando la necesidad de escanear líneas de indicaciones, pasar páginas y asuntos. de elección. En el método de entrada de dos tonos, para tres caracteres y cuatro caracteres, ingrese la consonante inicial de cada carácter como un código y agregue espacios si es necesario. Para caracteres desconocidos, puede ingresar "\" para llamar a "Simulación de escritura a mano". Si bien puedes personalizar la frase, no admite la formación de palabras en línea. Al crear palabras, debe utilizar un editor de texto externo para ingresar el código y la frase correspondiente según el formato definido.

El método de introducción de dos sílabas fue un avance importante en la historia de la introducción de caracteres chinos y pinyin, y fue bien recibido por muchos mecanógrafos no profesionales de la época. Sin embargo, también tiene serios inconvenientes, hasta el punto de que ya casi nadie lo utiliza. En primer lugar, aunque la eficiencia de la entrada ha mejorado mucho en comparación con el Pinyin tradicional, todavía existe una brecha considerable en comparación con los métodos de entrada Pinyin a nivel de oración posteriores, como el ABC inteligente. Además, muchas palabras se pueden determinar mediante varias palabras al "definir palabras por palabras", mientras que algunas palabras son difíciles de encontrar para determinarlas y los usuarios a menudo se sienten perdidos. Aunque el método de entrada de dos tonos proporciona muchos otros métodos para resolver problemas de entrada de texto. Por ejemplo, existen seis reglas auxiliares para ingresar apellidos como Deng, Guo y Yao. No es fácil recordar estos métodos y saber cuándo utilizar cada método. Debido a que las palabras sólo se pueden producir sin conexión, personalizar frases es un inconveniente.

La tercera generación del método de entrada de codificación de caracteres chinos

A finales de la década de 1990, con la mayor reducción de los precios de las microcomputadoras, la mayor mejora de las capacidades de almacenamiento y procesamiento, la popularidad de Los sistemas operativos gráficos Windows y Con el auge de Internet, la interfaz de usuario se ha vuelto muy amigable. Las microcomputadoras han ingresado a gran escala a los hogares de la gente común en nuestro país y han ingresado a la educación primaria y secundaria, dándose cuenta verdaderamente de la gran popularidad de las microcomputadoras en. nuestro país.

La popularidad de las microcomputadoras ha hecho que escribir a máquina sea una habilidad básica para todos, al igual que escribir caracteres chinos; la necesidad de que alguien escriba es en realidad un signo de analfabetismo, al igual que la necesidad de que alguien escriba por ti. Esto creó una gran comunidad de mecanógrafos no profesionales. Los mecanógrafos como profesión están desapareciendo rápidamente. El modo de funcionamiento de los usuarios normales cuando escriben es "querer escribir", que es completamente diferente del modo de "escritura a ciegas" de los mecanógrafos profesionales. La "mecanografía táctil" requiere que el operador mire la pantalla lo menos posible. La información de retroalimentación proporcionada por el método de entrada solo resulta útil ocasionalmente cuando el operador no puede "escribir táctilmente"; el método de entrada proporciona retroalimentación. El método y la cantidad de información de retroalimentación tendrán un gran impacto en las actividades de entrada del operador. El sistema operativo gráfico de Windows proporciona requisitos previos para enriquecer las interfaces hombre-máquina y puede satisfacer las necesidades de información de retroalimentación diversa.

Las poderosas capacidades de almacenamiento y procesamiento de las microcomputadoras modernas proporcionan una base material para el nacimiento de nuevos métodos de entrada con uso intensivo de almacenamiento y procesamiento. Los programas de método de entrada ya no se limitan a la memoria residente de 64 KB de la era DOS. Las velocidades de computación Gigabit permiten ejecutar algoritmos inteligentes complejos. No sólo se ha ampliado la capacidad del disco duro de megabytes a gigabytes, sino que la velocidad de acceso al disco duro también ha mejorado considerablemente en comparación con la era DOS. Almacenar una enorme biblioteca de vocabulario en su disco duro y buscarla rápidamente ya no es un problema.

Después de que la educación informática se impartiera ampliamente en las escuelas primarias y secundarias, los estudiantes comenzaron a aprender a mecanografiar desde una edad temprana. Se planteó la relación entre la codificación de caracteres chinos y la educación del idioma. El requisito mínimo es que la codificación de caracteres chinos no pueda entrar en conflicto con el conocimiento del idioma. Idealmente, la introducción de la codificación de caracteres chinos debería combinarse con el aprendizaje del conocimiento del idioma para promoverse mutuamente.

Bajo los antecedentes anteriores, surgió el método de entrada de codificación de caracteres chinos de tercera generación. Su ideología rectora es: estandarización, fácil de aprender, fácil de usar y tratar de mantener la velocidad de entrada. Durante este período, la investigación sobre métodos inteligentes de entrada Pinyin alcanzó su clímax, y también aparecieron códigos gráficos puros que utilizaban trazos o pares de trazos como unidades de entrada, así como códigos gráficos Pinyin basados ​​en consonantes y trazos iniciales (o pares de trazos). 29]-[48] .

(1) Método de entrada inteligente de Pinyin

El método de entrada inteligente de Pinyin se puede dividir en cuatro tipos según su principio de implementación: basado en comprensión, basado en estadísticas pragmáticas, basado en coincidencia de plantillas y basado en el contexto.

Smart ABC es actualmente el método de entrada Pinyin a nivel de casi oración más utilizado en los sistemas operativos Windows, porque convierte frases y frases en lugar de oraciones completas. La característica más importante de Smart ABC es que es muy conveniente personalizar frases y ajustar el orden de las palabras repetidas. Los usuarios solo necesitan ingresar de acuerdo con sus propias ideas y no necesitan segmentar palabras manualmente al ingresar. El sistema segmentará automáticamente las palabras una a una de adelante hacia atrás. Cuando no hay una frase, el sistema muestra automáticamente palabras repetidas en modo de una sola palabra para que el usuario las seleccione; una vez que el usuario selecciona y forma una nueva palabra, el sistema puede recordarla. Cuando la segmentación de palabras del sistema es incorrecta o las palabras proporcionadas por el sistema no son las que el usuario necesita, el usuario también puede modificarlas y el sistema también puede recordar las modificaciones realizadas por el usuario. Después de un largo período de uso, si el usuario no cambia, el sistema se adapta gradualmente a los hábitos de uso del usuario, haciendo que el proceso de entrada del usuario sea cómodo.

Smart ABC también tiene mucho margen de mejora. En primer lugar, puede utilizar libremente la ortografía completa, la ortografía corta o la ortografía mixta al ingresar, y el importador puede convertir palabras fonéticas en cualquier momento. Hay muchas formas para que los usuarios sepan cuál es la mejor. Parece muy flexible, pero en realidad le da al usuario la tarea de optimizar la entrada. Sin embargo, la mayoría de los usuarios no son expertos en este campo y no pueden completar bien esta tarea, lo que resulta en muchos desvíos o hábitos de entrada malos e ineficientes. En segundo lugar, la precisión de la conversión de fonética a caracteres no es alta y las oraciones cambian con frecuencia, lo que da como resultado una velocidad de entrada insatisfactoria. Incluso el uso de Shuangpin no es tan eficiente como el código natural.

Microsoft Pinyin es un verdadero método de entrada inteligente de conversión de fonética a carácter a nivel de oración, que es el resultado de años de investigaciones científicas en la tecnología de procesamiento del lenguaje natural de Microsoft. Microsoft Pinyin utiliza Pinyin como método de entrada de caracteres chinos. Los usuarios pueden utilizar y dominar fácilmente esta tecnología de entrada de caracteres chinos sin necesidad de aprendizaje ni formación especiales. Microsoft Pinyin adopta un modo de conversión de oraciones completas basado en oraciones. Los usuarios pueden ingresar continuamente oraciones completas en Pinyin sin segmentación manual de palabras ni selección de palabras candidatas. Esto no solo garantiza la fluidez del pensamiento de los usuarios, sino que también mejora en gran medida la eficiencia de la entrada. La interfaz persona-computadora proporcionada por Microsoft Pinyin es muy distintiva. La ventana de agrupación de palabras se puede incrustar en el cursor de inserción del texto que se ingresa, lo que reduce la frecuencia de movimiento de los ojos del usuario durante la entrada y mejora en gran medida la facilidad de uso del método de entrada. Convierte clave por clave y solicita resultados de conversión para que los usuarios no tengan que decidir cuándo realizar la conversión ellos mismos. No hay límite para la longitud del código que un usuario puede ingresar. Cuando la longitud del sistema excede el límite superior o se encuentra un período, el sistema realizará la conversión automáticamente para que el usuario pueda continuar escribiendo sin interrupción. Microsoft Pinyin puede lograr una alta precisión de conversión debido a su amplio contexto. Microsoft Pinyin rechaza a los usuarios ingresar pinyin corto y pinyin mixto de forma predeterminada, lo que puede guiar a los usuarios a desarrollar buenos hábitos de entrada.

Microsoft Pinyin también tiene algunos problemas. Primero, es engorroso e ineficiente editar dentro de una oración cuando la codificación se ingresa incorrectamente o la conversión es incorrecta. En segundo lugar, al cambiar las claves una por una, el contenido convertido correctamente a menudo se modifica incorrectamente. El usuario tiene que controlar la exactitud del contenido ingresado en cualquier momento, lo cual resulta muy agotador cuando hay mucho contenido convertido. Además, Microsoft Pinyin no proporciona un método para acelerar la entrada de palabras ni un método para introducir palabras desconocidas. Es un método de entrada incompleto.

Métodos de entrada basados ​​en trazos (o pares de trazos) y/o letras iniciales

El uso de trazos y consonantes iniciales, los dos caracteres chinos más simples, puede mejorar enormemente el aprendizaje del método de entrada [ 12]. Sin embargo, los trazos de los caracteres chinos generalmente se dividen en cinco tipos. Muy pocos tipos de trazos aumentarán inevitablemente la longitud de la codificación, lo que afectará la velocidad de entrada. Por lo tanto, cómo acortar la longitud del código y mejorar la eficiencia de la entrada se ha convertido en una cuestión clave para el éxito de este método de entrada.

El código de doble trazo desarrollado por Fujian Double-stroke Code Software Development Co., Ltd. es un código de glifos puro basado en trazos. Para superar el problema de que haya muy pocos tipos de trazo, se introdujo un nuevo tipo de trazo "cruz" en el código de doble trazo, ampliando los tipos de trazo a seis. Al recuperar códigos, realice un trazo de cada dos para formar un par de bolígrafos, que puede formar 36 pares de bolígrafos diferentes. Seleccione la entrada de tecla en el área de teclas correspondiente del teclado.

Además, la especificación de doble trazo también estipula que los códigos junto a la palabra enfermedad, "口", "lado de la mano" y "日" deben tratarse como un todo. Según las formas combinadas de las diferentes estructuras de los caracteres chinos, los caracteres chinos se dividen en tres fuentes básicas: tipo de izquierda-derecha, tipo de arriba-abajo y tipo completo. No importa qué tipo de caracteres chinos sean, todos están codificados según cuatro códigos. El método de entrada de frase de código doble es: utilizar dos caracteres para ingresar los dos primeros códigos de cada carácter tres caracteres para ingresar el primer y último código de los dos primeros caracteres, cuatro caracteres y más para ingresar el primero, segundo y tercero; y El primer dígito de la última palabra.

Las ventajas del código Erbi son: en comparación con el método tradicional de entrada de componentes, la memoria se reduce mucho; la longitud promedio del código después de usar pares de lápices y codificación de 36 teclas también es bastante corta; presione pares de bolígrafos, pero al presionar un solo trazo, puede transferir fácilmente el código de doble trazo al teclado numérico. Sin embargo, las deficiencias del código de doble trazo también son muy obvias: como método de entrada de trazo, sus reglas de adquisición y codificación de código son complicadas y hay muchas excepciones, por lo que todavía es muy difícil aprender la fila superior de teclas numéricas; se utiliza para la codificación, lo cual es inconveniente de escribir. Los conflictos de entrada numéricos de uso común afectan la velocidad de entrada real.

El método de entrada de dos tiempos inventado por el Sr. Chen Jinsong es uno de los métodos de entrada más utilizados actualmente. Es un método de entrada basado en consonantes y trazos iniciales, y también se puede introducir simplemente en función de los trazos. Los 30 caracteres codificados del método de entrada de dos trazos se distribuyen en 6 áreas del teclado universal, a saber, 5 áreas de doble trazo y 1 área de un solo trazo. Según el segundo trazo de un trazo doble o de un trazo único, el área se coloca en el orden de horizontal, vertical, izquierda, punta y pliegue. Pero establecer las 10 claves del radical requiere memorización. El método de entrada de dos trazos divide los caracteres chinos en caracteres individuales y caracteres combinados según la estructura de la fuente. Al ingresar caracteres chinos, el primer código es la primera letra del Pinyin chino y el trazo es el segundo código, hasta cuatro códigos. Si son menos de cuatro yardas, debes tomarlas todas. Si no puedes deslizar dos veces, debes hacerlo una sola vez. No es necesario dividir la monografía; el primer código es la primera letra de Pinyin y el segundo código es el código de trazo en el orden de los trazos, hasta cuatro códigos. El kanji combinado se divide en dos mitades. De acuerdo con las reglas del orden de los trazos de los caracteres chinos, la primera parte es la primera mitad y la segunda parte es la segunda mitad. El primer código toma la primera letra de Pinyin, la primera mitad del segundo código toma el primer y segundo trazo, la segunda mitad del tercer código toma el primer y segundo trazo, y la última mitad del cuarto código toma el tercero y cuartos golpes. Las reglas de codificación de frases del método de entrada Erbi son: para dos caracteres, tome los dos primeros códigos de cada carácter, para tres caracteres, tome los dos primeros códigos del primer carácter y los dos primeros códigos de los dos últimos caracteres, para cuatro y Tome los primeros tres códigos y los dos últimos códigos de los caracteres anteriores.

Las ventajas del método de entrada Erbi son: las reglas de codificación son más simples que el código Erbi, utilizando solo 30 caracteres codificados, utiliza dos tipos de codificación de información de características de caracteres chinos, consonantes iniciales y trazos, para mejorar; la capacidad de identificar palabras con el mismo código, mejorando la eficiencia de entrada. Para palabras desconocidas, también puede ingresarlas en forma completa si presiona trazos individuales en lugar de pares de bolígrafos, también se puede trasplantar fácilmente al teclado numérico. Sin embargo, todavía existen algunos problemas con el método de entrada de dos trazos: debido al uso de pares de plumas y radicales, los caracteres individuales y los caracteres combinados deben distinguirse para diferentes codificaciones, y todavía es difícil de aprender y usar.

Método de entrada de codificación de teclado numérico

Hasta ahora, el número de teléfonos móviles en mi país ha superado los 300 millones y el valor de salida de mensajes de texto de teléfonos móviles ha superado los 5 mil millones de yuanes. El número de usuarios de teléfonos móviles ha superado al de usuarios de PC, y el número de personas que utilizan teléfonos móviles para introducir caracteres chinos supera con creces el número de personas que utilizan teclados de uso general para introducir caracteres chinos.

Actualmente, el método de entrada de trazos T9 pinyin y T9 de la empresa estadounidense Tejie, el método de entrada de trazos Ci Neng de la empresa canadiense Ziyuan y el método de entrada iTap de Motorola han monopolizado la entrada de teléfonos móviles en China continental. , Hong Kong y Taiwán mercado legal. Sin embargo, los métodos de entrada del teclado numérico de teléfonos móviles extranjeros no son satisfactorios. Tomando como ejemplo la entrada de trazos, iTap usa 9 trazos, los caracteres pueden usar 8 trazos y T9 usa 5 trazos. Los mismos trazos se pueden colocar en diferentes posiciones en diferentes teléfonos móviles y la velocidad de entrada no es la ideal.

Para romper el monopolio de los métodos de entrada de teléfonos móviles extranjeros en el mercado chino de teléfonos móviles, se ha solucionado la vergonzosa situación de los métodos de entrada de teléfonos móviles no estándar. En el Gran Salón del Pueblo se celebró el primer Concurso de Entradas Chinas Móviles y el Foro de la Cumbre de Aplicaciones de Tecnología de Entrada Digital en Caracteres Chinos, patrocinado por la Sociedad de Información China de China y organizado por Jinma Publishing House (Hong Kong) Co., Ltd. el 5438 de junio+065438+21 de octubre de 2004. , durante tres días. Entre los 32 equipos, 23 equipos participaron en la competencia de ingreso de código digital de caracteres chinos de teléfonos móviles simulados, y 9 equipos participaron en la competencia de ingreso de caracteres chinos de teléfonos móviles. Además de los esquemas de codificación digital que ya han participado, los cinco trazos digitales del Sr. Wang Yongmin [49] y los trazos digitales izquierdo y derecho del Sr. Zheng [50] han atraído más atención. A continuación solo se presentan los trazos T9 pinyin y T9 más utilizados, así como los códigos dorados y los números populares que ganaron el campeonato en la primera competencia de entrada móvil china.

Esencialmente, T9 Pinyin es una de las primeras tecnologías de entrada de teclado universal que utiliza tanto Pinyin como Lenovo. Su innovación más importante es que puede determinar si se puede combinar en sílabas mandarín legales basándose en las combinaciones de teclas del teclado del teléfono móvil, evitando así las desventajas tradicionales de presionar varias teclas para ingresar una letra pinyin. Sin embargo, cuando una combinación de teclas se aplica a varias sílabas mandarín legales y la sílaba mandarín predeterminada no es la que el usuario necesita, el usuario aún tiene que seleccionarla manualmente. Además, la ortografía extensa, la necesidad de presionar 1 tecla para ingresar al estado de selección y la excesiva interacción persona-computadora causada por Lenovo hacen que la eficiencia de entrada del T9 Pinyin sea muy ineficiente, lo que lo hace muy difícil para las personas que no son muy buenas en mandarín.

Los trazos de T9 se dividen en cinco categorías: horizontal, vertical, izquierda, punto y pliegue, que están representados por 1, 2, 3, 4 y 5 respectivamente. Al grabar caracteres chinos, introdúzcalos en el orden de los trazos, solicitando uno por uno, varios en cada pantalla y dando prioridad a los caracteres de alta frecuencia. La entrada más larga tiene hasta 12 entradas y es compatible con Lenovo. Debido a que se utilizan cinco teclas para representar cinco trazos, no es necesario realizar juicios inteligentes sobre combinaciones como T9 Pinyin, y la lógica de procesamiento interno es muy simple. Los trazos T9 aprovechan al máximo la rica información de trazos y los bits de código más cortos de códigos de longitud desigual, y pueden seleccionar directamente palabras de código repetidas, por lo que su eficiencia de entrada real es mayor que la de T9 Pinyin.

El popular código numérico [51] codifica palabras utilizando 10 dígitos. Además de utilizar 1, 2, 3, 4 y 5 para representar los cinco trazos respectivamente, 6, 7, 8, 9 y 0 también se utilizan para representar los cinco tipos de piezas: intersección, inserción, ocho, pequeña, y boca. El primero, segundo, tercero, cuarto y últimos cinco códigos de un solo carácter se toman en el orden de los trazos. Si es insuficiente, se toma la longitud real del código. La longitud del código de frase es de 6 dígitos. El popular código numérico utiliza bastantes combinaciones de trazos como componentes, pero debido a su clasificación clara, es más fácil de recordar que muchos métodos de entrada similares, y las reglas de codificación detalladas reducen la tasa de repetición, lo que lo distingue de la competencia. Pero cabe señalar que utiliza muchos componentes, las reglas de codificación no son simples y es bastante difícil de aprender.

El código dorado codifica palabras utilizando nueve números. Además de usar 1, 2, 3, 4 y 5 para representar los cinco trazos respectivamente, 6, 7, 8 y 9 también se usan para representar los tipos de componentes boca, diez, ocho y shuai. Al codificar, se distinguen prefijos y sufijos, así como la diferencia entre caracteres individuales y caracteres combinados. Cuando la línea del mensaje no está vacía, 0, * y # se utilizan como teclas de selección. La característica más importante de Jinma es que cuando los números utilizados para la codificación y el código de entrada no pueden formar otro código de carácter, puede usar las teclas numéricas para seleccionar caracteres con el mismo código, lo que aumenta en gran medida la capacidad de selección de teclas del método de entrada y acorta la longitud promedio dinámica del código combinada con el uso de códigos de longitud desigual previsible de alta frecuencia, básicamente no hay necesidad de pasar las páginas al ingresar, lo que mejora aún más la eficiencia de la entrada. Sin embargo, no existe un estándar para distinguir prefijos y sufijos, lo que a menudo difiere de persona a persona. El uso dinámico de las claves de codificación restantes para seleccionar palabras recodificadas también provoca cambios excesivos en la posición de las claves de selección, lo que aumenta la carga de trabajo humano. interacción informática.

Los anteriores son algunos de los métodos de entrada familiares con los que he entrado en contacto desde que comencé a trabajar en computadoras. Me pregunto si pueden ayudarte.