Машинное обучение поможет установить личность анонимного кодера по его стилю
Специалисты в области стилометрии (исследование стилистики, включающее статистический анализ) хорошо знают, что письмо – это уникальный процесс. Словарный запас, синтаксис и грамматика создают индивидуальный почерк, позволяя определить автора текста. Существуют даже автоматизированные системы, способные идентифицировать человека, написавшего сообщение или публикацию в интернете. А недавнее исследование показало, что стилометрию можно применить и к искусственным языкам (программирование). Как оказалось, кодеры точно так же имеют свой стиль, который можно распознать.
Исследователи Рэйчел Гринстадт (Rachel Greenstadt) из Дрексельского университета и Айлин Калискан (Aylin Caliskan) из Университета Джорджа Вашингтона пришли к выводу, что код, как и другие формы стилистического выражения, не является анонимным. Результаты своей работы они представили на конференции DefCon. В исследовании учёные использовали машинное обучение для выявления авторов образцов кода. Алгоритм сначала идентифицирует все особенности в примерах, затем это список сокращают до 50, оставив только те, которые отличают разработчиков. Таким образом Гринстадт и Калискан создают «абстрактные синтаксические деревья», отражающие базовую структуру кода.
Для данного метода необходимо как можно больше образцов кода, чтобы научить алгоритм сопоставлять их с авторами. В таком случае, достаточно небольшого фрагмента кода из репозитория GitHub, чтобы отличить одного кодера от другого с высокой точностью, утверждают авторы исследования.
Гринстадт и Калискан вместе с другими учёными показали, как можно деанонимизировать программиста, используя его скомпилированный двоичный код. Им также удалось декомпиллировать его обратно на C++, сохранив уникальный стиль. Это работает примерно так, как если бы вы перевели документ в Google Translate на другой язык – текст выглядит совершенно иначе, но он сохранил орфографию и синтаксис.
Новая работа исследователей может быть использована для определения плагиата, особенно для новичков, которые часто копируют куски кода, или для выявления разработчиков вредоносного ПО. Они также надеются, что в будущем им удастся получить ответы на многие интересующие их вопросы, например, какие факторы влияют на стиль программирования, что происходит, когда члены одной команды работают вместе над проектом, отличаются ли стили программирования людей из разных стран и так далее. К слову, уже на данном этапе их алгоритм смог различить образцы кода канадских и китайских программистов с точностью более 90%.
Здесь выдают
ставки
ставки
Получить
Фотострана /
Интересные страницы /
Науки и технологии /
Высокие Технологии
/
Машинное обучение поможет установить личность анонимного кодера по его стилю
Высокие Технологии

Рейтинг записи:
5,5
- 4 отзыва
Многим читателям это понравилось

Посмотреть ещё 1 фотографию
10 распространенных ошибок в разговорной речи
Получи подборку мнемонических стихов, которые помогут тебе не допускать распространенных ошибок в разговорной речи.
1. Одеть брюки или надеть?
Одеваю я ...
Получи подборку мнемонических стихов, которые помогут тебе не допускать распространенных ошибок в разговорной речи.
1. Одеть брюки или надеть?
Одеваю я ...

Посмотреть ещё 9 фотографий
3D на грани фантастики от Джо Хилла и Макса Лоури
Сайт знакомств в Новой Адыгее для серьезных отношений и брака бесплатно
Сайт знакомств онлайн в Новой Адыгее для взрослых бесплатно
Сайт знакомств в Новой Адыгее без регистрации бесплатно
Сайт знакомств в Новой Адыгее с девушками с номерами телефонов бесплатно
Сайт знакомств в Новой Адыгее с женщинами кому за 35 без регистрации
Сайт знакомств в Новой Адыгее с мужчинами бесплатно
Сайт знакомств для секса в Новой Адыгее бесплатно
© 2008‒2025 Социально‐развлекательная сеть «Фотострана». Пользователей: 24 549 893 человека
ООО «Фотострана» ОГРН: 1157847426076 ИНН: 7813238556
197046, Санкт-Петербург, Певческий переулок, дом 12, лит. А
- Разделы сайта
- Сайт знакомств
- Встречи
- Астрахань Балашиха Барнаул Белгород Брянск Владивосток Волгоград Воронеж Екатеринбург Иваново Ижевск Иркутск Казань Калининград Кемерово Киров Краснодар Красноярск Курск Липецк Магнитогорск Махачкала Москва Набережные Челны Нижний Новгород Новокузнецк Новосибирск Омск Оренбург Пенза Пермь Ростов-на-Дону Рязань Самара Санкт-Петербург Саратов Сочи Ставрополь Тверь Тольятти Томск Тула Тюмень Улан-Удэ Ульяновск Уфа Хабаровск Чебоксары Челябинск Ярославль
- Знакомства и общение
Следующая запись: Lenovo анонсировала флагманский ультрабук ThinkPad P1 с ценником от от $1950
Лучшие публикации