[Antispam] конкуренты :))

Бориславский Д.В. boda@gorodok.net
Thu, 26 Aug 2004 09:28:44 +0700


Новый алгоритм для распознавания спама изобретен биологами 
исследовательского центра TJ Watson в Нью-Йорке, 
принадлежащего компании IBM. Он основан на методе, который 
используется учеными для анализа генетических 
последовательностей, сообщает BBC News. 
Работа над алгоритмом, названным "Чунг-Квей" (Chung-Kwei), 
начались около года назад. Ученые взяли за основу алгоритм 
"Терезиас" (Teiresias), который был создан для поиска 
отличающихся ДНК и аминокислот в повторяющихся образцах. 
Разработчики полагают, что алгоритм может использоваться в 
различных областях, не только в биологии. 

Письма электронной почты воспринимаются алгоритмом "Чунг-Квей" 
как молекулы ДНК, состоящие из множества символов. Перебирая 
письмо за письмом, программа накапливает собственную базу 
последовательностей символов, встречающихся в двух и более 
письмах. К примеру, слово "Виагра", найденное в нескольких 
тысячах писем, было внесено в базу шаблонов спама, и в 
дальнейшем сообщения, содержащие данное слово, будут 
распознаваться как нежелательные. 

При проведении тестовых испытаний на проверку 88 тысяч 
сообщений программой было потрачено 15 минут, и в 97 процентах 
случаев алгоритм верно распознал почтовый мусор. 

IBM полагает, что алгоритм "Чунг-Квей" станет самым 
эффективным инструментом против спама. Разработчикам осталось 
провести некоторые предварительные проверки перед выпуском 
программы в продажу. По их словам, в работе им очень помог 
огромный объем спама, который они получают на своем рабочем 
месте. 

http://lenta.ru/internet/2004/08/25/dna/

--
  Даниил Вл.                         mailto: boda@gorodok.net
  Бориславский                       ICQ:    159361505