¿Por qué la simulación no converge sin un servidor?
Es decir, algunas variables pueden convertirse en matrices numerosas y aún pueden participar en los cálculos, pero se pierde la capacidad de propagar gradientes, lo que resulta en la incapacidad de propagar gradientes a posteriores. variables.
2. El establecimiento de la tasa de aprendizaje no es razonable.
Establecer una tasa de aprendizaje demasiado alta puede hacer que la pérdida se convierta en nan, lo que hace que el modelo no converja. Configurarla demasiado pequeña puede hacer que el modelo aprenda lentamente.
3. Los parámetros de la capa de red neuronal no se inicializan correctamente.
Porque la inicialización de parámetros afectará la velocidad de entrenamiento del modelo.
4. Los parámetros de la capa de red neuronal no están calificados.
Si no se realiza el recorte de gradiente, se puede producir una explosión de gradiente, lo que hace que el modelo no pueda propagar gradientes efectivos hacia atrás.
5. Tiempos de entrenamiento insuficientes
Solo después de aprender lo suficiente, el modelo puede aprender buenas características. Si el entrenamiento del modelo finaliza prematuramente, el modelo no aprenderá buenas características.
6. El número de muestras en el lote de entrenamiento es demasiado pequeño, lo que hace que el valor de pérdida fluctúe y genere la ilusión de que el modelo no converge.
Respuesta el 26 de junio de 2022
Sé el primero en darle me gusta
Internautas entusiasmados con el bienestar público
Información relacionada que vale la pena leer recomendar.
Publicidad
Dispositivos inteligentes para personas mayores, con una excelente relación calidad-precio y fáciles de vender, ¡vaya a Taobao para comprar con confianza!
Voz grande, botones grandes, modo de espera prolongado para atención domiciliaria de pacientes, socorrista de emergencia para personas mayores, buscapersonas de teléfono móvil de emergencia con un solo toque, alarma de llamada residencial con un solo toque para personas mayores
380 yuanes
Nuevo teléfono móvil para personas mayores, tiempo de espera prolongado, gran volumen y pantalla grande Teléfono móvil Mobile China Telecom para personas mayores
188 yuanes
AGM H2 teléfono inteligente militar de tres pruebas 4G resistencia de red completa Teléfono móvil resistente al agua para personas mayores, China Unicom, China Telecom, voz grande, fuente grande, teléfono móvil de espera súper largo para personas mayores
1799 yuanes p>
Teléfono móvil Newman M560C para personas mayores, teléfono móvil de espera súper prolongado para personas mayores, teléfono antiguo recto con botón femenino genuino, teléfono móvil pequeño con pantalla grande, caracteres grandes y función de voz grande para personas mayores.
357 yuanes
Teléfono inteligente militar de tres pruebas con acceso completo a la red 4G, magnate electrónico de espera súper largo con personajes grandes y teléfono viejo con pantalla grande
936 yuanes
¿Es bueno que las mujeres coman cola de pescado? ¿Para qué tipo de personas es adecuada la cola de pescado? ¿Es bueno comer cola de pescado?
Información recomendada sobre cola de pescado que vale la pena leer.
Anuncio de Ningbo Yuxin Health Management Co., Ltd.
Más expertos
La razón por la que el modelo no converge
Experto 1 responde preguntas en línea a 1 .
Responda en 5 minutos | 10.000 encuestados profesionales
Haga una pregunta ahora
"Los fuegos artificiales más bellos" hizo una pregunta educativa y obtuvo buenas críticas.
Lan Qiu Wangzi consultó sobre un tema educativo y dio una reseña favorable.
Ajo consultó sobre un tema de educación y dio reseña favorable.
188 * * * 8493 consultaron sobre algún tema educativo y recibieron comentarios favorables.
Basketball Big Picture preguntó sobre un tema educativo e hizo un buen comentario.
Animal Park consultó sobre un tema educativo y dio una reseña favorable.
AKA consultó sobre un tema educativo y dio una reseña favorable.
Recomiende contenido más interesante para usted——
¿Cómo presentar una queja ante los investigadores de seguridad pública?
Respuesta en vídeo
Abogado Wang Shujing
Respuesta el 29 de marzo de 2022
249 me gusta 2 vistas
Muebles al por mayor, vaya a Alibaba y obtenga suministro directo de los fabricantes.
1688 Anuncio
Trajes personalizados, trajes de boda, trajes de negocios, trajes de novio, trajes de alta costura para hombre, versión coreana
1188 yuanes 165438 yuanes
Comprar
Simba.taobao.com Publicidad
Jet Li quería cambiar su nacionalidad a china, pero fue rechazado tres veces. Ahora quiere volver a sus raíces.
¿Lo logrará?
Todo el mundo conoce a Jet Li. Tiene una gran reputación en el país y en el extranjero. Nos ha traído muchos trabajos clásicos de cine y televisión y confía en
Entertainment Genius
Septiembre de 2022 Respuesta-14
156 Vistas
Uniformes personalizados_Encuentre productos, precios y fábricas de uniformes personalizados_Vaya a Alibaba.
Anuncio 1688
¿Cómo calcular el salario de 15 días de baja por maternidad?
Respuesta en vídeo
Firma de abogados Guozun
Respuesta-31 de marzo de 2022
247 me gusta 3860 visitas
Huang Xuan apareció en el aeropuerto con su novia. ¿Quién es su novia?
Video respuesta
Relajante y amable, Xiaomiao6902
Respuesta el 2022-11-09
24 me gusta y 1 comentario
p>
¡No te pierdas las decenas de millones de productos cerca de la tienda de personalización de trajes de Taobao, con categorías completas!
Anuncio de reventa de Taobao
Los medios de Hong Kong fotografiaron a Aaron Kwok y su esposa Fang Yuan visitando una tienda de conveniencia. ¿Cómo capturó Fang Yuan el corazón del rey?
Creo que su carácter personal es muy superior al de otras celebridades comunes de Internet, especialmente en términos de diligencia, ahorro, inteligencia y virtuosidad. Esta es también la razón por la que puede conseguirlo.
La Teoría de la Vida del Quesito
Contestada el 26 de julio de 2022
544 visitas
Cargando
Todo
Compruebe si los datos de entrada son normales. ¿Hay datos anormales (todos ceros, gt es incorrecto)?
¿Deben normalizarse los datos?
Si es consistente con el estándar de entrada original del modelo previamente entrenado.
¿Es correcto el preprocesamiento de datos?
Simplifica tus problemas.
Comprueba tu propia función de pérdida.
Comprueba si faltan entradas.
Comprueba la capa de red personalizada
Comprueba la configuración de la capa congelada.
Compruebe si la información de dimensiones coincide.
Comprobación de retorno de gradiente
Comprueba los parámetros de inicialización del modelo.
¿Son razonables las configuraciones de hiperparámetros?
Regularización simplificada
Conversión mutua entre el modo de entrenamiento y el modo de prueba
Visualización (pesos, funciones de activación, histogramas de pesos, actualizaciones de capas)
Utilice diferentes optimizadores
Explosión de gradiente y desaparición de gradiente (verifique el valor de gradiente)
Ajuste la tasa de aprendizaje (un orden de magnitud diferente del peso, el peso es 0,1, el aprendizaje la tasa es 0,001).
Valor de NaN (reduzca la tasa de aprendizaje, observe si hay división por 0/operación pequeña, verifique la primera posición donde aparece NaN, ajuste la función de activación)
Referencia