- 过度拟合:alta varianza,memoriza el entrenamiento y Falla en datos nuevos;包括正规化、验证、更新、退出、更多数据和提前停止。
- 欠拟合:alto sesgo、incapaz de aprender coaches;减少更多复杂性、更多时代、特征和常规调整方面的重大工程。
- Sesgo-varianza:批判平衡;复杂化可以减少变化,反之亦然。
- 实践要点:数据校准、标准化、漂移监控、k-fold、集成(bagging/boosting)和迁移学习。
Cuando entrenamos 机器学习模型,buscamos algo muy claro:que funcionen bien con los data que ya han visto y,sobre todo,con datos nuevos。 理解和概括记忆之间的平衡 这是原始设计和生产系统之间的差异。
这个问题是中间的问题,不是微不足道的。 Dos fallos clásicos lo entorpecen:过度拟合(sobreajuste)和欠拟合(subajuste)。 El Primero aparece cuando el modelo se pega tanto a los datos de entrenamiento que confunde el ruido con la señal;第二个,简单的模型(o está tan limitado)是基本的赞助人。 En las siguientes secciones vas a ver las causas, señales, ejemplos, 关系与变化,是一种实用技术库。
过度拟合与欠拟合的关系
模型过度拟合会导致与竞争相关的问题,包括特殊情况和异常值,但无法修复。 Rinde de lujo en entrenamiento y flojea en validación o test。 Es como un estudiante que se aprende las repuestas de memoria: clava el simulacro, pero en el examen real se pierde.
El 欠拟合 es la cara opuesta。 无法捕捉问题结构的模型: rinde mal tanto en entrenamiento como en 测试。想象一下调整直角和曲线的位置; por muy bien que la estires, no va a encajar bien。 El subajuste suele venir acompañado de alto sesgo y baja varianza.
在实践中,我们发现了与度量和不同的组合相关的情况。 交涉和仲裁之间的巨大差异, mientras que resultados pobres en ambos sugieren subajuste。 Además,修订了在其他情况下继续进行的操作。
Sesgo y varianza:微妙平衡
错误的原因: sesgo(偏见)和变体 (变异分析)。 El sesgo sube cuando el modelo hace suposiciones demasiado fuertes (excesiva simplicidad), lo que se traduce en underfitting。模型的变化是非常明智的,因为它会导致过度拟合。
着名的 权衡 sesgo-varianza 你必须遇到中间的问题。 Al Increar la complejidad, suele bajar el sesgo pero sube la varianza;简单化,相反地发生。 A lo largo del entrenamiento, el sesgo tiende a disminuir mientras la varianza puede crecer,请注意验证的配合,不得造成不确定。
快速:预测生命的珍贵。 Una recta (alto sesgo) puede quedarse corta si la relación es curvilínea (欠拟合); un polinomio de grado 4 que toque cada punto puede capturar el ruido(alta varianza,过度拟合);乌纳 温和的曲线 (例如,un polinomio de grado 2 bienregularizado)suele dar el mejor compromiso。

共同识别问题
需要注意的事项包括: 测试中的精度和清晰度较差; Pérdida de entrenamiento bajando mientras la pérdida de validación empieza a subir;敏感的极端 a pequeños cambios en la entrada;你却 多个完整的“ganen”模型是不可概括的.
Para el subajuste, fijate en métricas mediocres en ambos conjuntos y en aprendizaje estancado: si tras varias épocas no mejora la puntuación,测验 el modelo no tiene capacidad suficiente。其他的主题是对大将军们的预测:对市长分类的预测进行分类,对媒体的 apenas se aleja 进行回归。
La validación cruzada ayuda a ver el cuadro completo. Una alta variabilidad entre pliegues (folds) suele apuntar a 过拟合。 Coherencia en la mediocridad, en cambio, Huele a underfitting。 Valen tanto 精度与预测错误 (MAE, MSE) 或特定指标有关。
过度拟合的习惯原因
La Primera sospechosa es la complejidad。 与可提供的候选数据和多样化数据相关的 demasiados 参数模型 了解当地的特殊情况。 También influye entrenar durante demasiado tiempo sin control: si no aplicas parada temprana, 模型 puede pasar de aprender 赞助人记忆.
其他通过控制变量的技术来实现: 与许多相关性无关的特征 empujan al modelo a ver relaciones fantasma。解决问题的小代表 la muestra no enseña suficiente variacion Como para que el modelo Generalice。
在深层次的神经元中,具有双线武装的代表能力。 如果规则化和数据足够,则可以轻松地进行调整。包括批次大小(批量大小)在内的多个方面,可帮助您记住超出精度的顾客。
欠拟合的习惯原因
El subajuste suele venir de 问题复杂性的简单过度模型 (例如,lineales sobre relaciones no lineales)。拉斯 正规化 demasiado fuertes (L1/L2) también pueden “ahogar” el aprendizaje 义务是一种简单的过度解决方案。
其他因素是其他因素。硅 无法识别相关因素的特征, el modelo no puede aspirar a aprenderlos。 正常化/标准化的进展不顺利 由于欠拟合,优化和翻译变得困难。
最后,我要告诉你 没有足够的时间 (muy pocas épocas o iteraciones), cuando 很快就退休了, o cuando la calidad de los datos impide aprender los 赞助人 de fonto por ruido excesivo.
苋菜
图像和视觉:si una red para dígitos manuscritos memoriza píxeles concretos, 与数字文字的其他操作相关的 puede clavar el entrenamiento y Fallar (过度拟合)。科莫技术公司 数据增强(rotaciones、volteos) 优先考虑一般化。
财务:时间序列模型 未来的未来 si está sobreajustado。如果欠拟合,您将无法重新调整结构。
一个奇怪的问题是,机器人与平衡机器人之间存在着某种奇妙的联系,它最终完成了具体的任务。 机器人在安全方面表现得非常完美,但在新的阶段却有问题。 Falta Generalización fuera del guion。
在气象学中,意图预测气候变化的温度,风向或预测。 Esa pobreza de 变量会导致欠拟合: ciego 的模型位于 termómetro 的下方。
Por qué el sobreajuste puede ser “peor” que el subajuste
Hay un matiz teórico importante。联合国 极端的下定性模型 podría dar siempre una Constante,忽略输入:su error en test rondaría la 变量对象的变量。 En cambio, un modelo sobreajustado que interpola todos los puntos del entrenamiento puede 一般错误与不同的错误 测试公共潜力。
这首诗包含了中音等级的政策或包含了 MLP 的参数: al ajustarse a cada punto, “oscilan” entre observaciones y crean valoresabsurdos fuera de la muestra。结果是敌人的退化 no tiene un tope claro.
过度拟合与 sobreparametrización:没有儿子 lomismo
方便区分终点。 过度参数化 重要的是模型类别主要是代表问题结构的必要能力。 过度拟合 发生 cuando,dado un modelo concreto, 优化形式以提高效率和推广能力。就规则化而言,可能的模型是不存在任何问题的。 Las técnicas de Regularización (por ejemplo, ridge o lasso) ayudan a “desacoplar” ambos Conceptos.
评估和监测调整
将流感分为 entrenamiento、validación 和 prueba。 米拉精度、分段测量误差。 Si el entrenamiento va bien pero la validación cae, sospecha de sobreajuste; si los dos van mal, probablemente falta capacidad o datos.
La validación cruzada (k-fold) 减少了单独参与的结论。 下巴哈地区的媒体验证和设计, hay más guarantías de que el modelo genericiza. También es clave definir un conjunto de evaluación Final (test) que 不要在调整髋关节参数时佩戴帽子.
另外, 保持时间分布的数据分布。数据漂移(cambios en la distribución de entrada)可将其转换为不可维护的功能模型: 监测和再进入周期 esparte de la receta, no un lujo。
减少过拟合的技术
Datos y más datos. 体积和多样性的增强 ayuda a que el modelo aprenda 赞助人 de fundo en lugar de tallesaccidentales。 Eso sí, mejor calidad que cantidad: 消除异常值、扭曲和校正错误 是优先事项。
正则化。 L1(套索)支持特性选择 al llevar pesos a cero; L2(山脊)惩罚措施 encogiendo los pesos sin anularlos。 弹性网 将大使和其他人结合起来,在中间的终点站。
建筑与培训。 神经网络中的 Dropout 神经元的任意选择和模型依赖于特定的规则。恩阿博莱斯, la poda(修剪)和 limitar profundidad o número de hojas recorta la complejidad. 帕拉达·坦普拉纳:监控有效性和最佳性能的监控。
验证和选择。 k折交叉验证 Para validar Decisiones de ajuste y evitar escoger el “mejor” modelo alone por suerte。 减少变量数量 o elegir mejor cuáles entran puede bajar la varianza y mejorar la可解释性。
Optimización y lotes. Lotes pequeños 介绍了 ruido “saludable” 的渐变效果, lo que a menudo mejora la genericización;许多巨大的人都青睐于优化和优化的托盘。
减速欠拟合技术
Capacidad del modelo. 提交完整的数据 (polinómico en vez de lineal,arboles más profundos,redes menos superficiales)。 La clave está en no pasarse de frenada y acompañarlo de validaciones sólidas.
正规化和时间安排。 Si estás penalizando en exceso, 呼吸模型的调整。时代号: 一个简单的模型需要更多的时间来理解, siempre con un ojo en la validación para no caer en sobreajuste。
特征和预处理。 放大和放大特征 (interacciones、terminos polinómicos、codificaciones adecuadas de Variablescategóricas)。 Normaliza o estandariza 在算法中,升级过程中没有“favorezca”变量。 En muchos casos, 过滤噪声 eleva la señal útil.
Datos y cobertura. 代表减少子调整概率的更多数据。 Si el conjunto se queda corto, plantéate 转移学习 展望 NLP 的代表部分,并以“no arranca”为模型。
数据质量、漂移和自动化
La calidad de datos manda. 精确性、完整性和一致性 deberíanaudarse y cruzarse con fuentes fiables。科莫技术公司 标准化 (0-1) 或标准化(媒体 0,设计 1) evitan 是 escala 的素数模型。
Con el tiempo, los datos cambian. El 数据漂移 puede causar tanto 过度拟合 como 欠拟合 en el nuevo contexto。记录:监控指标、检查分配和重新调整实际数据。
的工具 AutoML 加快技术参数的选择、特性工程和评估管道的创建,解放对中音的分析。 Un apunte histórico: el servicio Amazon 机器学习 你不接受新的现实; si trabajas con documentación antigua, tenlo Presente.
塞纳莱斯·克拉夫和世俗盛事
在一天一天的实践中,很多人都这样:dudando si el modelo está sobreajustando o si 简单地说。就体验而言,se vuelve rutina mirar tres cosas: gran brecha entre train y test (sobreajuste), resultados concentemente bajos en ambos (subajuste), y varianza alta entre Folds (sobreajuste de manual).
没有任何关于公平的争论。 一条曲线可以帮助你记住记忆的有效性。一旦发生,请及时进行调整。
Ensamblados、特性选择和设计
结合 ayudan 的方法。 套袋(como Random Forest)减少方差 y suele ser buen antídoto contra el sobreajuste; Boosting (como XGBoost) 减少 sesgo y puede Levantar modelos demasiado simples, aunque hay que cuidarlo para que no sobreajuste.
La 特征选择 消除冗余或不相关的变量, 减少噪音 y mejora la generalización。这是一种有效的补救措施,可以解决因输入过多而出现的问题。
Sobre el tamaño de lote ya lo insinuamos: 很多小东西都引入了梯度变化和优秀将军的菜单;很多伟大的pueden empujar a soluciones que clavan el entrenamiento pero pierden en test。
算法:empieza sencillo, escala cuando toque
取决于问题和数据,以及家庭的不同之处。 Si hay fronteras claras, SVM or arboles pueden ir de maravilla。结合伟大的和复杂的、深刻的或组合的力量的最近的灵活性。 k-NN 线性回归模型 子程序包含数据集和原始解释能力。
比较有效的策略 简单版本和并行版本 Con un buen esquema de validación。 Aveces lo complejo apenas aporta mientras suma fragilidad。 没有必要建立“更复杂”的模型,在现实世界中实现更多的可能性.
谈判中的使用和注意事项
在此情况下,医院或特定群体的情况将得到普遍预测。 Sobreajustar a 赞助人 locales puede ser peligroso;亚贾斯塔尔,伊努蒂尔。 En finanzas, modelos que 历史记忆 未来的翻译。
在车辆自动驾驶中,侦察对象的检测系统 不同的环境;请记住具体图像。 En NLP,情感分析 “de carrerilla” 的 entrenamiento frases frases,没有任何新公式。
A nivel de negocio, el sobreajuste da lugar a 误报 (例如,欺诈) oa estrategias que parecían prometedoras en validación interna pero se desploman al desplegarse。 El subajuste, por suparte, 生产 predicciones tibias que apenas superan reglas triviales, minando la confianza en elEquipo de datos.
常见的预防措施和实践方法
¿Cómo ayuda la selección de características a evitar sobreajuste? Al quitar ruido y redundancias, 区别变量和一般化。 Es de las primeras medidas a probar si sospechas entradas irrelevantes.
¿Los ensembles 减少了 ambos 问题吗? 装袋 tiende a bajar varianza (menos sobreajuste) y 提升 bajar sesgo (menos subajuste)。 Bien ajustados,儿子herramientas muy poweres。
¿Por qué las redes profundas sobreajustan con facilidad? 因其巨大的能力。 正规化、退出和更多数据/增强 Son esenciales para mantenerlasHonestas。
¿El tamaño de lote influye? 是。 Lotes pequeños 介绍 ruido beneficioso que有利于一般化; Lotes grandes pueden “memorizar” con más facilidad。
¿Transfer learning ayuda? 许多。 Aprovecha 代表 ya aprendidas y 减少数据集上的 subajuste (falta de capacidad efectiva) como de sobreajuste。
可快速行动清单
与实践记录相关的部分,如下 格兰差距训练/测试、 调整、调整、补充、更多数据, 提前停止, 辍学,poda en arboles,y valida con k-fold。西韦斯 mal en train y test,考虑更多的能力,更多的时间, bajar regularización、主要特性、预先处理(normalizar/estandarizar)。
Y no olvides lo operativo: monitoriza 漂移, planifica reentrenos, cuida la calidad de datos y, si tiene sentido, apóyate en AutoML 高级参数总线和评估管道的机械部件自动化。
平衡的要点: 佩尔塞吉尔·鲁伊多的船长。存在着平衡,模型功能与实验室功能; cuando se rompe, llegan los sustos。获取探测器 las señales、aplicar las técnicas adecuadas 和 cuidar los data es lo que 《马卡拉报》中“正确”和“勇敢”之间的差异.