Devi Susila de Khongbantabam
El correo electrónico es una herramienta de comunicación rápida y rentable para los usuarios. Por el contrario, el número de usuarios de correo electrónico ha impulsado el intenso crecimiento de los correos basura en las últimas eras. Este problema de los correos basura es uno de los riesgos sustanciales de Internet. La creciente cantidad de correos basura hace que sea importante contar con filtros antispam confiables. Por lo general, los spammers envían correos electrónicos no deseados y no solicitados a varios destinatarios y estos correos basura son en su mayoría idénticos en sus características. Por lo tanto, es esencial diseñar un sistema de defensa que encuentre eficazmente los correos basura y proporcione un proceso alternativo para el filtro independiente. Por lo tanto, en este documento se propone un nuevo marco para clasificar el correo electrónico en correos basura y correos basura utilizando la clasificación de bosques aleatorios basada en atributos. El proceso comienza con el cálculo de probabilidad de spam bayesiano para cada token, el esquema de ponderación TF-IDF calcula el peso de cada token y el correo, el cálculo de la puntuación se realiza en función de la aptitud genética y, finalmente, el proceso de clasificación se realiza utilizando un clasificador de bosques aleatorios para clasificar los correos electrónicos en correos electrónicos spam y correos electrónicos no deseados. Los resultados se comparan con los métodos de clasificación de spam existentes en términos de precisión de clasificación, precisión ponderada y medida F1. Los resultados muestran que el sistema propuesto muestra resultados prometedores en comparación con otros algoritmos existentes.