Tip:
Highlight text to annotate it
X
Би било хубаво да въведем малко основни термини,
които се използват в изкуствения интелект, за да различаваме различните проблеми.
Първо, ще ви обясня разликата между напълно и частично обозрими среди.
Една среда се нарича напълно обозрима, ако това, което агентът вижда
във всеки един момент е напълно достатъчно, за да се изгради оптимално решение.
Примерно, в много игри с карти,
при положение, че всички карти са на масата, тяхното моментно състояние
е напълно достатъчно за оптимален избор.
В някои други среди, за да вземе най-доброто възможно решение,
агентът има нужда от допълнителна памет.
Примерно, при игра на покер картите не се намират на масата
и запомнянето на вече миналите карти ще доведе до по-добро решение.
За по-пълно разбиране на разликата, нека си представим един агент,
който взаимодейства със средата посредством своите
сензори и ефектори, като това става в продължение на много цикли,
още познато, като цикъл на възприятие-действие.
За повечето среди е достатъчно да приемем,
че средата притежава някакъв вид вътрешно състояние.
Примерно, в игра на карти, където не всички карти са поставени на масата,
състоянието може се отнася до картите в ръката ни.
Една среда е напълно обозрима, ако сензорите могат винаги да видят
цялото състояние на средата.
Частично обозрима е, ако сензорите могат да видят само част от това състояние,
като при това, запомняйки предишни изчисления, допълваме информацията
за частта, която не се вижда в момента.
Следователно всяка игра, в която, примерно, изминалите ходове
носят информация за вероятната ръка на противника, е частично обозрима
и изисква по-различен подход.
Много често агентите, работещи в частично обозрими срези,
използват вътрешна памет, за да разберат какво е
състоянието на средата.
Когато говорим за скритите модели на Марков, ще разберем как
се съхранява такава вътрешна памет.
Второто понятие за околната среда се отнася до това, дали средата
е детерминирана или стохастична.
Детерминираната среда е тази, в която всяко действие на агента
уникално определя изхода.
Примерно, в шаха никога няма елемент на случайност при местене на фигура.
Резултатът от местенето на фигурата е предопределен
и, независимо от това къде местя фигурата, резултатът остава същия.
Това наричаме детерминираност.
Игрите със зарове, като табла, са стохастични.
Въпреки че местенето на пуловете е детерминирано,
изходът от действието зависи и от числата на заровете,
които не могат да се предвидят.
Тъй като резултатът от хвърлянето на заровете включва случайност,
то този тип игри ще наричаме стохастични.
Нека ви разкажа малко за дискретните и непрекъснатите среди.
Дискретна среда е тази среда, в която имате краен брой действия
и краен брой неща, които можете да усетите.
Примерно, в шаха позициите на дъската са краен брой, което означава,
че можете да извършите краен брой неща.
Разликата от непрекъсната среда се изразява в това,
че множеството от възможни действия или неща, които можете да усетите, е безкраен.
Примерно, в дартса съществуват безкрайно много начини за избор на ъгъл или
начална скорост на стреличката.
Последния тип среди това са приятелски срещу враждебни.
Ако една среда е приятелска, тя е произволна.
Може да бъде стохастична, но няма за цел
да пречи на нашата задача.
Примерно, времето е приятелска среда.
Може да бъде всякакво. Може дори да попречи на вашите действия.
Но не го прави с такава цел.
Напълно противоположна идея има враждебната среда, срещаща се в игри като шах,
където противникът се старае да ви хване.
Оказва се много по-трудно да се намери подходяща стратегия във
враждебна среда, където противникът ви наблюдава и се старае да се противопостави
на всяко ваше действие, за разлика от приятелската среда, която може и
да ви пречи, но не го прави с такава цел.
Нека да проверим каква част от тези определения ви станаха ясни,
като направим следния тест.
Ето ги отново четирите понятия: частично срещу напълно обозрима,
стохастична срещу детерминирана, непрекъсната срещу дискретна,
враждебна срещу приятелска.
Нека разгледаме играта на шашки.
Изберете кои атрибути са приложими към играта.
Ако смятате, че играта е частично обозрима, изберете тук.
В противен случай не избирайте.
Ако смятате, че е стохастична, изберете това.
непрекъсната - изберете тук; враждебна - изберете тук.
Ако не знаете правилата на шашки (checkers), можете да проверите
в Google, за да намерите информация относно нея.