Книга Антология машинного обучения. Важнейшие исследования в области ИИ за последние 60 лет - Терренс Дж. Сейновски
Шрифт:
Интервал:
Закладка:
Сейчас это глобальная исследовательская организация, базирующаяся в Канаде. – Прим. ред.
245
Смотри предисловие в: Churchland P. S. and Sejnowski T. J. The Computational Brain, 2nd edition, Cambridge, MA: MIT Press (2016).
246
Восемнадцать квинтиллионов четыреста сорок шесть квадриллионов семьсот сорок четыре триллиона семьдесят три миллиарда семьсот девять миллионов пятьсот пятьдесят одна тысяча шестьсот пятнадцать. – Прим. ред.
247
Судьба изобретателя шахмат неизвестна. – Прим. авт.
248
Tesauro G., Sejnowski T. J. A Parallel Network That Learns to Play Backgammon, Artificial Intelligence Journal, 39, 357–390, 1989.
249
Richard Sutton (1988). «Learning to predict by the methods of temporal differences». Machine Learning. 3 (1): 9–44.
250
Richard Bellman’s algorithm for dynamic programming. Richard Bellman (1961). Adaptive control processes: a guided tour. Princeton University Press.
251
Ричард Саттон погиб в апреле 2021 года в возрасте 83 лет. – Прим. ред.
252
Саттон Р. С., Барто Э. Г. Обучение с подкреплением / Перевод с английского А. А. Слинкина. М.: ДМК-Пресс, 2020.
253
Tesauro Gerald (1995). “Temporal Difference Learning and TD-Gammon”. Communications of the ACM 38 (3) 58–68.
254
Полный перебор, или метод «грубой силы» (англ. brute force) – метод решения задачи путем перебора всех возможных вариантов. – Прим. ред.
255
Ученые, использующие систематический подход к изучению поведения людей и животных. – Прим. ред.
256
Garcia J., Kimeldorf D. J., Koelling R. A. “Conditioned aversion to saccharin resulting from exposure to gamma radiation.” Science 1955; 122: 157–8.
257
Montague P. R., Dayan P., Sejnowski T. J. “A Framework for Mesencephalic Dopamine Systems Based on Predictive Hebbian Learning”, Journal of Neuroscience, 16(5), 1936–1947, 1996.
258
Schultz W., Dayan P., Montague P. R. (1997) “A neural substrate of prediction and reward”. Science. 275: 1593–9.
259
Tobler P. N., O’Doherty J. P., Dolan R. J., Schultz W. “Human Neural Learning Depends on Reward Prediction Errors in the Blocking Paradigm”. Journal of Neurophysiology.95(1):301–310. 2006.
260
Hammer M., Menzel R. “Learning and memory in the honeybee”. J Neurosci. 15: 1617–30. 1995.
261
Real L. A. 1991. Animal choice behavior and the evolution of cognitive architecture. Science 253:980–86.
262
Montague P. R., Dayan P., Person C., Sejnowski T. J. Bee foraging in uncertain environments using predictive Hebbian learning. Nature 377: 725–728, 1995.
263
Mischel Walter; Ebbesen Ebbe B. (October 1970). «Attention in delay of gratification». Journal of Personality and Social Psychology. 16 (2): 329–337.
264
Atari – американская компания по производству и изданию компьютерных игр, существует с 1972 года. Pong – серия игровых приставок производства Atari, которая выпускалась с 1975 по 1977 год. – Прим. ред.
265
V. Mnih, K. Kavukcuoglu, D. Silver, A. A. Rusu, J. Veness, M. G. Bellemare, A. Graves, M. Riedmiller, A. K. Fidjeland, G. Ostrovski, S. Petersen, C. Beattie, A. Sadik, I. Antonoglou, H. King, D. Kumaran, D. Wierstra, S. Legg, D. Hassabis. “Human-level control through deep reinforcement learning”. Nature 518, 529–533 (2015)
266
Компьютерная игра в жанре стратегии в реальном времени, выпущенная в 1998 году. – Прим. ред.
267
Microsoft приобрела права на игру в 2014 году. В 2020 году Minecraft стала самой продаваемой игрой в истории. – Прим. ред.
268
Haykin S. Cognitive Dynamic Systems Perception Action Cycle, Radar and Radio; Cambridge University Press: New York, NY, USA, 2012.
269
Haykin S., Fuster J. M., Findlay D., Feng S. Cognitive Risk Control for Physical Systems, IEEE Access (в прессе).
270
Reddy G., Celani A., Sejnowski T. J., Vergassola M. Learning to soar in turbulent environments, Proceedings of the National Academy of Sciences of the United States of America, 113 (33), 2016.
271
Изменение высоты полета за единицу времени. – Прим. ред.
272
Doya K., Sejnowski T. J. “A Novel Reinforcement Model of Birdsong Vocalization Learning” In: Tesauro G., Touretzky D. S., Leen T. (Ed.), Advances in Neural Information Processing Systems, 7, MIT Press, Cambridge, MA 101–108, 1995.
273
Doupe A. J., Kuhl P. K. “Birdsong and human speech: common themes and mechanisms”. Annu Rev Neurosci. 22:567–631, 1999.
274
Turrigiano G. (2011). «Too many cooks? Intrinsic and synaptic homeostatic mechanisms in cortical circuit refinement». Annu Rev Neurosci. 34:89–103.
275
Wiskott L., Sejnowski T. J. “Constrained Optimization for Neural Map Formation: A Unifying Framework for Weight Growth and Normalization”, Neural Computation, 10(3), 671–716, 1998.
276
Тело нейрона, в котором находится ядро клетки. – Прим. ред.
277
Anthony J. Bell, “Self-organization in real neurons: Anti-Hebb in 'Channel Space'?” Advances in Neural Information Processing Systems 4, 1991; M. Siegel, E. Marder, L. F. Abbott, “Activity-dependent current distributions in model neurons”, Proc Natl Acad Sci U S A. 91: 11308–11312 (1994).
278
«Brains, Minds and Machines».
279
«Bits and Brains».
280
Темы, обсуждаемые на Конференции, доступны по ссылке: nips.cc
281
Чтобы показать особенности этого языка, вот случайное предложение из недавнего обзора в журнале: «Олигодендроциты представляют собой множество белков, ингибирующих рост аксонов, включая миелин-ассоциированный гликопротеин, ингибитор нейрита-выроста «Nogo», олигодендроцит-миелиновый гликопротеин и семафорины». Bireswar Laha, Ben K. Stafford, Andrew D. Huberman, Regenerating optic pathways from the eye to the brain, Science 356:.1031–1034, 2017. – Прим. авт.
282
Говард Вахтел, нейробиолог из Университета Колорадо в Боулдере, который изучал нервную систему аплизии. – Прим. авт.
283
На 2018 год. 1 Збайт = 1021 байт. – Прим. ред.
284
Чаще даже в русскоязычной профильной литературе употребляется термин «data science». – Прим. ред.
285
Официальный сайт: www.sdss.org
286