Недавно обсуждали с приятелем...

Posted on Mon 14 June 2021 • Tagged with from_telegram, in_russian

Недавно обсуждали с приятелем о том, как подходить к незнакомой ML задаче. И это повод как-то сформулировать фреймворк, которому следую я сам.

  1. Собрать небольшой, но качественный датасет (или взять готовый, если задача позволяет; см. также мой старый пост)
  2. Поверхностно понять продуктовую задачу и попытаться ее сформулировать в терминах ML. Например, "нужно распознавать ключевые фразы по аудио" ⇒ sound classification (disclaimer - я как раз почти ничего не знаю об этой задаче).
  3. Уточнить формулировку в гугле, найти соответствующий раздел на paperswithcode, взять оттуда пяток свежих SotA статей.
  4. Погуглить task name + survey для поиска обзорных статей по теме.
  5. Бегло прочитать все это, опционально прочитать еще пару статей, которые часто цитируются в прочитанных.
  6. Получив базовую интуицию, подытожить, что в прочитанных статьях является свистелками-перделками, а что - ядром подходов. Например, для sound classification будет логично, что перегнать звук в спектрограмму, аугментировать (pitch, mixup) и натравить CNN - это важно, а attention на последнем слое - не очень.
  7. Построить бейзлайн (или с нуля, или на базе готовой реализации, найденной на paperswithcode).
  8. ...
  9. PROFIT

Дополнения и критика приветствуются в комментариях!

source