Стоит отметить, что зачастую полиция может определить IP-адрес, чтобы узнать от кого пришла электронная почта, однако, в большинстве случаев они находят несколько человек по этому адресу.
Вместе со своей командой, Бенджамин Фунг, профессор инженерных информационных систем, использовали методы, которые используются в распознавании речи и интеллектуальном анализе данных с целью выявления повторяющихся, т.е. отличительных особенностей комбинаций, которые повторяются в письмах подозреваемого.
Например, анонимные письма могут иметь опечатки или грамматические ошибки, или могут быть полностью написаны в нижнем регистре. Исследователи используют эти уникальные особенности для определения автора письма.
"Используя этот метод, мы можем определить с высокой степенью точности автора данного письма, узнать его пол, национальность и уровень образования", сказал Фунг.
Чтобы убедиться в эффективности новой техники, исследователи проанализировали Enron Email Dataset, который представляет собой коллекцию из более чем 200000 реальных писем от 158 сотрудников Enron Corporation.
Команда использовала выборку из 10 различных сообщенияй. В ходе тестов новая техника показала точность от 80 до 90 процентов, сообщает Gizmag.
Комментарии: