Anatoly Levenchuk (ailev) wrote,
Anatoly Levenchuk
ailev

Учебный проект для начинающих заниматься машинным обучением

В оригинале Monica Anderson писала "проект по искусственному интеллекту для начинающих" (хотя предмет проекта в части именно "для начинающих" много уже) и сформулировала предельно лаконичную и понятную последовательность действий (http://www.quora.com/What-are-basic-artificial-intelligence-projects-for-beginners):
Take a book in electronic format like a Jane Austen book from project Gutenberg. Take the last chapter in that book. Remove all the spaces.

Now write a computer program to put all the spaces back. You can easily count how many it got right since you have the original text.

1. Do it using Hidden Markov Models based on a frequency dictionary of English.

2. Do it using a Genetic Algorithm using an oracle based on the same frequency dictionary.

3. Do it using machine learning to learn a Model of English based on all the other chapters of the book as a training corpus using only unsupervised learning.

You can expect to get about 85% correct using the first two methods.
If you get results better than 95% correct, talk to me.
If you get 99.99% correct using #3 then you have created a true AI.
По моему опыту, хороший учебный проект обычно очень трудно подобрать. И он должен формулироваться очень похоже: на этом проекте должно быть возможно продемонстрировать учебные, профессиональные и экстраординарные достижения, а постановка задачи должно быть легко оцениваема даже неспециалистами. Когда я приводил пример робота-теннисиста как пример учебного проекта (http://ailev.livejournal.com/1159346.html), то ровно это и было основанием для выбора.
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 10 comments