Detecção Automática de SPIM e SMS Spam usando Método baseado no Princı́pio da Descrição mais Simples (original) (raw)

MDLText aplicado na Filtragem Automática de SPIM e SMS Spam

iSys, 2018

Spam filtering in online instant messages and SMS is a challenging problem nowadays. It is because the messages are often very short and rife with slangs, idioms, symbols, emoticons, and abbreviations which hamper predicting and knowledge discovering. In order to face this problem, we evaluated a simple, fast, scalable, multiclass, and online text classification method based on the minimum description length principle. We conducted experiments using a real and public dataset, which demonstrate that our method is effective on instant messaging and SMS spam filtering in both online and offline learning contexts.

Análise de Métodos de Aprendizagem de Máquina para Detecção Automática de Spam Hosts

Anais do XII Simpósio Brasileiro de Segurança da Informação e de Sistemas Computacionais (SBSeg 2012)

Web spamming é um dos principais problemas que afeta a qualidade das ferramentas de busca. O número de páginas web que usam esta técnica para conseguir melhores posições nos resultados de busca é cada vez maior. A principal motivação são os lucros obtidos com o mercado de publicidade online, além de ataques a usuários da Internet por meio de malwares, que roubam informações para facilitar roubos bancários. Diante disso, esse trabalho apresenta uma análise de técnicas de aprendizagem de máquina aplicadas na detecção de spam hosts. Experimentos realizados com uma base de dados real, pública e de grande porte indicam que as técnicas de agregação de métodos baseados em árvores são promissoras na tarefa de detecção de spam hosts.

Técnicas de detecção e classificação de spam DOI: 10.5585/exacta.v4i2.767

Exacta

Neste artigo, serão abordadas as técnicas de detecção, avaliação e classificação da mensagem eletrônica não-solicitada enviada em massa (spam), com ênfase nas técnicas de análise que empregam inteligência artificial (IA) e redes, que interagem compartilhando informações sobre a origem desses e-mails pela internet. Três cenários serão utilizados, com o intuito de apresentar uma comparação entre as técnicas bayesiana, filtro com base em assinaturas, greylist e DNSBL( domain name system black list).

Um Modelo Adaptativo para a Filtragem de Spam

Spamming has been a great problem to internet users and service providers. Recent research points towards the employment of machine learning algorithms to spam filtering. However, many works that have been done in the area do not recognize the dynamic aspect of spam, rendering the filtering process solely as a text categorization problem. This work presents an adaptive model for spam filtering that takes into consideration the dynamicity of spam. The model is applied making use of adaptive Huffman trees, support vector machines and aging of messages. Resumo. O aumento do número de spam tem sido um grande problema para usuários e provedores de Internet. Pesquisas recentes apontam para o uso de algoritmos de aprendizagem de máquina para a construção de filtros, mas a maioria dos trabalhos não reconhece o caráter dinâmico do spam, julgando a filtragem como uma atividade de classificação de texto. Este artigo apresenta um modelo adaptativo para a filtragem de spam que leva em consideraç...

Avaliação de Classificadores Anti-spam Aplicada no Campo de Cabeçalho de E-mail "From

2000

With the appearance of the Internet, the e-mail became one of the fastest ways of communication . However this benefit has been threatened by Unsolicited Commercial E-mail know as Spam, undesirable messages that fill the post office boxes, make the user lose time and generate traffic in the Internet. The problem became more serious when in March of 2003 the

DroidAutoML: uma Ferramenta de AutoML para o Domínio de Detecção de Malwares Android

Anais Estendidos do XXII Simpósio Brasileiro de Segurança da Informação e de Sistemas Computacionais (SBSeg Estendido 2022)

Neste trabalho apresentamos a DroidAutoML, uma ferramenta de AutoML especializada para o domínio de detecção de malwares Android. A partir de um dataset de entrada e um pipeline de dados de quatro estágios, a DroidAutoML possibilita a geração automática de modelos preditivos otimizados. Os resultados iniciais indicam que a ferramenta é capaz de gerar modelos muito bons, chegando a 95% de recall.

MDLText e Indexação Semântica aplicados na Detecção de Spam nos Comentários do YouTube

iSys - Brazilian Journal of Information Systems, 2017

Muitos usuários do YouTube produzem conteúdo regularmente e fazem desta tarefa seu principal meio de vida. Contudo, esse sucesso vem despertando a atenção de usuários mal-intencionados, que propagam comentários indesejados para se autopromoverem ou para disseminar links maliciosos. Neste cenário, métodos tradicionais de categorização de texto podem sofrer limitações devido às características inerentes ao problema: (1) os comentários costumam ser curtos e mal redigidos e (2) o problema de classificação é naturalmente online. Este artigo avalia um método de classificação baseado no princípio da descrição mais simples e compara os resultados com os de métodos tradicionais de aprendizado online. Também é proposta uma técnica ensemble, que combina os métodos de classificação com diferentes técnicas de processamento de linguagem natural. Os experimentos foram cuidadosamente realizados e a análise estatística dos resultados indica que a técnica proposta obteve desempenho superior ao obtido...