{"id":1341,"date":"2026-02-10T19:26:34","date_gmt":"2026-02-10T22:26:34","guid":{"rendered":"https:\/\/www.galirows.com.br\/meublog\/?p=1341"},"modified":"2026-02-28T21:45:48","modified_gmt":"2026-03-01T00:45:48","slug":"tudo-sobre-mse-rmse","status":"publish","type":"post","link":"http:\/\/www.galirows.com.br\/meublog\/blog\/tudo-sobre-mse-rmse\/","title":{"rendered":"O importante a saber sobre MSE e RMSE"},"content":{"rendered":"\n<p>MSE e RMSE s\u00e3o duas m\u00e9tricas associadas e muito utilizadas para avaliar o desempenho de modelos de previs\u00f5es num\u00e9ricas. De maneira geral, \u00e9 dito que essas m\u00e9tricas penalizam erros grandes e s\u00e3o sens\u00edveis a <em>outliers<\/em>. Vou explicar aqui porque isso acontece.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Defini\u00e7\u00e3o de MSE e RMSE<\/h2>\n\n\n\n<p>Irei inicialmente definir o que \u00e9 o MSE e o RMSE. <\/p>\n\n\n\n<p>O <strong>MSE (Mean Squared Error)<\/strong> calcula a m\u00e9dia dos erros ao quadrado entre valores previstos e reais. Ele \u00e9 calculado pela equa\u00e7\u00e3o a seguir.<\/p>\n\n\n\n<div class=\"wp-block-math\"><math display=\"block\"><semantics><mrow><mi>M<\/mi><mi>S<\/mi><mi>E<\/mi><mo>=<\/mo><mfrac><mn>1<\/mn><mi>n<\/mi><\/mfrac><mrow><munderover><mo movablelimits=\"false\">\u2211<\/mo><mrow><mi>i<\/mi><mo>=<\/mo><mn>1<\/mn><\/mrow><mi>n<\/mi><\/munderover><\/mrow><mo form=\"prefix\" stretchy=\"false\">(<\/mo><msub><mi>y<\/mi><mi>i<\/mi><\/msub><mo>\u2212<\/mo><msub><mover><mi>y<\/mi><mo stretchy=\"false\" class=\"tml-xshift\" style=\"math-style:normal;math-depth:0;\">^<\/mo><\/mover><mi>i<\/mi><\/msub><msup><mo form=\"postfix\" stretchy=\"false\">)<\/mo><mn>2<\/mn><\/msup><\/mrow><annotation encoding=\"application\/x-tex\">MSE = \\frac{1}{n}\\sum_{i=1}^{n}(y_i &#8211; \\hat{y}_i)^2<\/annotation><\/semantics><\/math><\/div>\n\n\n\n<p>Onde:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><math xmlns=\"http:\/\/www.w3.org\/1998\/Math\/MathML\"><semantics><mrow><msub><mi>y<\/mi><mi>i<\/mi><\/msub><\/mrow><annotation encoding=\"application\/x-tex\">y_i<\/annotation><\/semantics><\/math>\u200b = valor real<\/li>\n\n\n\n<li><math xmlns=\"http:\/\/www.w3.org\/1998\/Math\/MathML\"><semantics><mrow><msub><mover accent=\"true\"><mi>y<\/mi><mo>^<\/mo><\/mover><mi>i<\/mi><\/msub><\/mrow><annotation encoding=\"application\/x-tex\">\\hat{y}_i<\/annotation><\/semantics><\/math> = valor previsto pelo modelo<\/li>\n\n\n\n<li><math xmlns=\"http:\/\/www.w3.org\/1998\/Math\/MathML\"><semantics><mrow><mi>n<\/mi><\/mrow><annotation encoding=\"application\/x-tex\">n<\/annotation><\/semantics><\/math> = n\u00famero de amostras<\/li>\n<\/ul>\n\n\n\n<p>Sua import\u00e2ncia \u00e9 devido:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Penaliza grandes erros<\/strong> devido ao termo quadr\u00e1tico.<\/li>\n\n\n\n<li>Muito usado durante o <strong>treinamento do modelo<\/strong> como fun\u00e7\u00e3o de custo (loss function).<\/li>\n\n\n\n<li>\u00datil para comparar modelos em termos <strong>relativos<\/strong> (qual erra menos no quadrado).<\/li>\n<\/ul>\n\n\n\n<p>O <strong>RMSE (Root Mean Squared Error)<\/strong> \u00e9 simplesmente a raiz quadrada do MSE, podendo ser representado pelas duas equa\u00e7\u00f5es a seguir: <\/p>\n\n\n\n<div class=\"wp-block-math\"><math display=\"block\"><semantics><mrow><mi>R<\/mi><mi>M<\/mi><mi>S<\/mi><mi>E<\/mi><mo>=<\/mo><msqrt><mrow><mfrac><mn>1<\/mn><mi>n<\/mi><\/mfrac><mrow><munderover><mo movablelimits=\"false\">\u2211<\/mo><mrow><mi>i<\/mi><mo>=<\/mo><mn>1<\/mn><\/mrow><mi>n<\/mi><\/munderover><\/mrow><mo form=\"prefix\" stretchy=\"false\">(<\/mo><msub><mi>y<\/mi><mi>i<\/mi><\/msub><mo>\u2212<\/mo><msub><mover><mi>y<\/mi><mo stretchy=\"false\" class=\"tml-xshift\" style=\"math-style:normal;math-depth:0;\">^<\/mo><\/mover><mi>i<\/mi><\/msub><msup><mo form=\"postfix\" stretchy=\"false\">)<\/mo><mn>2<\/mn><\/msup><\/mrow><\/msqrt><\/mrow><annotation encoding=\"application\/x-tex\">RMSE = \\sqrt{\\frac{1}{n}\\sum_{i=1}^{n}(y_i &#8211; \\hat{y}_i)^2}<\/annotation><\/semantics><\/math><\/div>\n\n\n\n<p>ou,<\/p>\n\n\n\n<div class=\"wp-block-math\"><math display=\"block\"><semantics><mrow><mi>R<\/mi><mi>M<\/mi><mi>S<\/mi><mi>E<\/mi><mo>=<\/mo><msqrt><mrow><mi>M<\/mi><mi>S<\/mi><mi>E<\/mi><\/mrow><\/msqrt><\/mrow><annotation encoding=\"application\/x-tex\">RMSE = \\sqrt{MSE}\n<\/annotation><\/semantics><\/math><\/div>\n\n\n\n<p>Sua import\u00e2ncia \u00e9 devido:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Retorna o erro <strong>na mesma unidade da vari\u00e1vel prevista<\/strong>.<\/li>\n\n\n\n<li>Facilita a <strong>interpreta\u00e7\u00e3o pr\u00e1tica<\/strong> (ex.: erro m\u00e9dio de 12 metros).<\/li>\n\n\n\n<li>Mant\u00e9m a propriedade de <strong>penalizar grandes erros<\/strong>, herdada do MSE.<\/li>\n\n\n\n<li>\u00c9 mais comunic\u00e1vel para relat\u00f3rios t\u00e9cnicos e tomada de decis\u00e3o.<\/li>\n<\/ul>\n\n\n\n<p>Perceba que o c\u00e1lculo do RMSE exige uma opera\u00e7\u00e3o a mais do que do MSE (\u00e9 preciso fazer o c\u00e1lculo da raiz quadrada do MSE). Sendo assim, para treinar o modelo \u00e9 melhor computacionalmente utilizar o MSE.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Exemplo 1 &#8211; o b\u00e1sico<\/h2>\n\n\n\n<p>Suponha um modelo que prev\u00ea <strong>dist\u00e2ncia percorrida em metros<\/strong>. A tabela abaixo mostra os valores reais esperado e o previsto por um modelo.<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table class=\"has-fixed-layout\"><thead><tr><th>Amostra<\/th><th>Real (m)<\/th><th>Previsto (m)<\/th><th>Erro<\/th><th>Erro\u00b2<\/th><\/tr><\/thead><tbody><tr><td>1<\/td><td>10<\/td><td>9<\/td><td>1<\/td><td>1<\/td><\/tr><tr><td>2<\/td><td>12<\/td><td>13<\/td><td>-1<\/td><td>1<\/td><\/tr><tr><td>3<\/td><td>15<\/td><td>14<\/td><td>1<\/td><td>1<\/td><\/tr><tr><td>4<\/td><td>14<\/td><td>15<\/td><td>-1<\/td><td>1<\/td><\/tr><tr><td>5<\/td><td>18<\/td><td>16<\/td><td>2<\/td><td>4<\/td><\/tr><tr><td>6<\/td><td>20<\/td><td>23<\/td><td>-3<\/td><td>9<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<p>O erro m\u00e9dio encontrado \u00e9 de 1,5 metros conforme c\u00e1lculo do MAE abaixo. Lembrando que a equa\u00e7\u00e3o utiliza o m\u00f3dulo do erro e com isso os valores negativos tornam-se positivos. O resultado mostra que o modelo erra em m\u00e9dia 1,5 metros por previs\u00e3o.<\/p>\n\n\n\n<div class=\"wp-block-math\"><math display=\"block\"><semantics><mrow><mi>M<\/mi><mi>A<\/mi><mi>E<\/mi><mo>=<\/mo><mfrac><mrow><mn>1<\/mn><mo>+<\/mo><mn>1<\/mn><mo>+<\/mo><mn>1<\/mn><mo>+<\/mo><mn>1<\/mn><mo>+<\/mo><mn>2<\/mn><mo>+<\/mo><mn>3<\/mn><\/mrow><mn>6<\/mn><\/mfrac><mo>=<\/mo><mfrac><mn>9<\/mn><mn>6<\/mn><\/mfrac><mo>=<\/mo><mn>1,5<\/mn><\/mrow><annotation encoding=\"application\/x-tex\">MAE = \\frac{1+1+1+1+2+3}{6} = \\frac{9}{6} = 1,5<\/annotation><\/semantics><\/math><\/div>\n\n\n\n<p>O erro m\u00e9dio ao quadrado do modelo \u00e9 de <strong>2,83 m\u00b2<\/strong>. N\u00e3o \u00e9 intuitivo, mas mostra forte penaliza\u00e7\u00e3o nos erros maiores. Ele n\u00e3o \u00e9 intuitivo porque pode parecer que ele erra em torno de 2,83 metros cada previs\u00e3o, mas no geral ele teve previs\u00f5es melhores do que isso.<\/p>\n\n\n\n<div class=\"wp-block-math\"><math display=\"block\"><semantics><mrow><mi>M<\/mi><mi>S<\/mi><mi>E<\/mi><mo>=<\/mo><mfrac><mrow><mn>1<\/mn><mo>+<\/mo><mn>1<\/mn><mo>+<\/mo><mn>1<\/mn><mo>+<\/mo><mn>1<\/mn><mo>+<\/mo><mn>4<\/mn><mo>+<\/mo><mn>9<\/mn><\/mrow><mn>6<\/mn><\/mfrac><mo>=<\/mo><mfrac><mn>17<\/mn><mn>6<\/mn><\/mfrac><mo>=<\/mo><mn>2,83<\/mn><\/mrow><annotation encoding=\"application\/x-tex\">MSE = \\frac{1+1+1+1+4+9}{6} = \\frac{17}{6} = 2,83<\/annotation><\/semantics><\/math><\/div>\n\n\n\n<p>A partir do RMSE \u00e9 feito um ajuste no erro para tornar a interpreta\u00e7\u00e3o melhor. Veja que RMSE do exemplo resulta em 1,68 metros, pr\u00f3ximo ao valor do MAE, mas penalizando o modelo no erro maior de previs\u00e3o que ele teve. <\/p>\n\n\n\n<div class=\"wp-block-math\"><math display=\"block\"><semantics><mrow><mi>R<\/mi><mi>M<\/mi><mi>S<\/mi><mi>E<\/mi><mo>=<\/mo><msqrt><mrow><mi>M<\/mi><mi>S<\/mi><mi>E<\/mi><\/mrow><\/msqrt><mo>=<\/mo><msqrt><mn>2,83<\/mn><\/msqrt><mo>=<\/mo><mn>1,68<\/mn><\/mrow><annotation encoding=\"application\/x-tex\">RMSE = \\sqrt{MSE} = \\sqrt{2,83} = 1,68<\/annotation><\/semantics><\/math><\/div>\n\n\n\n<p>Em termos de diagn\u00f3stico do modelo:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>O modelo erra tipicamente <strong>1.5 m<\/strong><\/li>\n\n\n\n<li>Mas errou at\u00e9 <strong>3 m<\/strong>, o que impacta o RMSE.<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">Exemplo 2 &#8211; adi\u00e7\u00e3o de um outlier<\/h2>\n\n\n\n<p>Considere agora o exemplo anterior, mas com a altera\u00e7\u00e3o da previs\u00e3o da \u00faltima amostra, de forma a adicionar um <em>outlier<\/em>.<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table class=\"has-fixed-layout\"><thead><tr><th>Amostra<\/th><th>Real (m)<\/th><th>Previsto (m)<\/th><th>Erro<\/th><th>Erro\u00b2<\/th><\/tr><\/thead><tbody><tr><td>1<\/td><td>10<\/td><td>9<\/td><td>1<\/td><td>1<\/td><\/tr><tr><td>2<\/td><td>12<\/td><td>13<\/td><td>-1<\/td><td>1<\/td><\/tr><tr><td>3<\/td><td>15<\/td><td>14<\/td><td>1<\/td><td>1<\/td><\/tr><tr><td>4<\/td><td>14<\/td><td>15<\/td><td>-1<\/td><td>1<\/td><\/tr><tr><td>5<\/td><td>18<\/td><td>16<\/td><td>2<\/td><td>4<\/td><\/tr><tr><td><strong>6<\/strong><\/td><td><strong>20<\/strong><\/td><td><strong>35<\/strong><\/td><td><strong>-15<\/strong><\/td><td><strong>255<\/strong><\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<p>As m\u00e9tricas calculas s\u00e3o:<\/p>\n\n\n\n<div class=\"wp-block-math\"><math display=\"block\"><semantics><mrow><mi>M<\/mi><mi>A<\/mi><mi>E<\/mi><mo>=<\/mo><mfrac><mrow><mn>1<\/mn><mo>+<\/mo><mn>1<\/mn><mo>+<\/mo><mn>1<\/mn><mo>+<\/mo><mn>1<\/mn><mo>+<\/mo><mn>2<\/mn><mo>+<\/mo><mn>15<\/mn><\/mrow><mn>6<\/mn><\/mfrac><mo>=<\/mo><mn>3,5<\/mn><\/mrow><annotation encoding=\"application\/x-tex\">MAE = \\frac{1+1+1+1+2+15}{6} = 3,5<\/annotation><\/semantics><\/math><\/div>\n\n\n\n<p><\/p>\n\n\n\n<div class=\"wp-block-math\"><math display=\"block\"><semantics><mrow><mi>M<\/mi><mi>S<\/mi><mi>E<\/mi><mo>=<\/mo><mfrac><mrow><mn>1<\/mn><mo>+<\/mo><mn>1<\/mn><mo>+<\/mo><mn>1<\/mn><mo>+<\/mo><mn>1<\/mn><mo>+<\/mo><mn>4<\/mn><mo>+<\/mo><mn>255<\/mn><\/mrow><mn>6<\/mn><\/mfrac><mo>=<\/mo><mn>38,83<\/mn><\/mrow><annotation encoding=\"application\/x-tex\">MSE = \\frac{1+1+1+1+4+255}{6} = 38,83<\/annotation><\/semantics><\/math><\/div>\n\n\n\n<p><\/p>\n\n\n\n<div class=\"wp-block-math\"><math display=\"block\"><semantics><mrow><mi>R<\/mi><mi>M<\/mi><mi>S<\/mi><mi>E<\/mi><mo>=<\/mo><msqrt><mn>2,83<\/mn><\/msqrt><mo>=<\/mo><mn>6,23<\/mn><\/mrow><annotation encoding=\"application\/x-tex\">RMSE = \\sqrt{2,83} = 6,23<\/annotation><\/semantics><\/math><\/div>\n\n\n\n<p>Enquanto o MAE aumentou 2,6 vezes o valor devido ao outlier (um crescimento linear), o aumento do MSE aumentou 19 vezes, mostrando que essa m\u00e9trica \u00e9 extremamente sens\u00edvel ao outlier.<\/p>\n\n\n\n<p>Em termos de diagn\u00f3stico do modelo:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>O modelo <strong>parece razo\u00e1vel no MAE<\/strong>.<\/li>\n\n\n\n<li><strong>Parece ruim no RMSE<\/strong> (tipicamente o erro \u00e9 bem menor).<\/li>\n\n\n\n<li><strong>Parece p\u00e9ssimo no MSE<\/strong> (o valor de erro \u00e9 maior do que os valores que deveriam ser previstos).<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">Preciso mostrar MSE e RMSE na avalia\u00e7\u00e3o do meu modelo?<\/h2>\n\n\n\n<p>Se o MSE e o RMSE n\u00e3o adicionam nova informa\u00e7\u00e3o estat\u00edstica na avalia\u00e7\u00e3o do modelo (como RMSE \u00e9 a raiz quadrada do MSE eles s\u00e3o matematicamente dependentes), pode surgir o questionamento se mostrar os dois em uma publica\u00e7\u00e3o \u00e9 realmente necess\u00e1rio. O fato \u00e9 que n\u00e3o \u00e9 <strong>estritamente necess\u00e1rio<\/strong> mostrar MSE e RMSE juntos, mas em muitos contextos t\u00e9cnicos e acad\u00eamicos \u00e9 <strong>recomend\u00e1vel <\/strong>porque eles oferecem <strong>duas vis\u00f5es complementares do mesmo erro<\/strong>: uma <strong>matem\u00e1tica<\/strong> (MSE) e outra <strong>interpret\u00e1vel<\/strong> (RMSE).<\/p>\n\n\n\n<p>Al\u00e9m de uma vis\u00e3o <strong>complementar (precis\u00e3o estat\u00edstica + significado f\u00edsico do erro<\/strong>), a publica\u00e7\u00e3o das duas m\u00e9tricas permite a compara\u00e7\u00e3o diretamente com trabalhos que reportam apenas um deles.<\/p>\n\n\n\n<p>Mas se n\u00e3o for para fins de compara\u00e7\u00e3o com outros trabalhos e sim para entender o resultado do modelo sendo avaliado, apenas o RMSE \u00e9 necess\u00e1rio (utiliza-se o MSE durante desenvolvimento\/treinamento do modelo e depois o RMSE para verificar interpretar o resultado).<\/p>\n\n\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>MSE e RMSE s\u00e3o duas m\u00e9tricas associadas e muito utilizadas para avaliar o desempenho de modelos de previs\u00f5es num\u00e9ricas. De maneira geral, \u00e9 dito que essas m\u00e9tricas penalizam erros grandes e s\u00e3o sens\u00edveis a outliers. Vou explicar aqui porque isso acontece. Defini\u00e7\u00e3o de MSE e RMSE Irei inicialmente definir o que \u00e9 o MSE e [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"footnotes":""},"categories":[6],"tags":[381],"class_list":["post-1341","post","type-post","status-publish","format-standard","hentry","category-ia","tag-metricas"],"aioseo_notices":[],"amp_enabled":true,"_links":{"self":[{"href":"http:\/\/www.galirows.com.br\/meublog\/wp-json\/wp\/v2\/posts\/1341","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/www.galirows.com.br\/meublog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.galirows.com.br\/meublog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.galirows.com.br\/meublog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/www.galirows.com.br\/meublog\/wp-json\/wp\/v2\/comments?post=1341"}],"version-history":[{"count":6,"href":"http:\/\/www.galirows.com.br\/meublog\/wp-json\/wp\/v2\/posts\/1341\/revisions"}],"predecessor-version":[{"id":1364,"href":"http:\/\/www.galirows.com.br\/meublog\/wp-json\/wp\/v2\/posts\/1341\/revisions\/1364"}],"wp:attachment":[{"href":"http:\/\/www.galirows.com.br\/meublog\/wp-json\/wp\/v2\/media?parent=1341"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.galirows.com.br\/meublog\/wp-json\/wp\/v2\/categories?post=1341"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.galirows.com.br\/meublog\/wp-json\/wp\/v2\/tags?post=1341"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}