Reinforcement Learning 6. Часть 2
Прочитаем и обсудим вместе статью от deepmind. Гипотеза награды достаточно предполагает, что агенты с мощными алгоритмами обучения с подкреплением, помещенные в богатую среду с простыми наградами, могут развить широкий, многоатрибутный интеллект, который составляет искусственный общий интеллект. Ссылка на статью в описании. Let s read and discuss together the article from deepmind. The rewardisenough hypothesis suggests that agents with powerful reinforcement learning algorithms when placed in rich environments with simple rewards could develop the kind of broad, multiattribute intelligence that constitutes an artificial general intelligence.
|
|