Механіка міркування великих мовних моделей: філософський аналіз

Автор(и)

  • Олександр Леонтійович Маєвський Інститут філософії ім. Г. С. Сковороди Національної академії наук України, Україна https://orcid.org/0000-0001-6063-6033

DOI:

https://doi.org/10.18523/2617-1678.2024.14.31-39

Ключові слова:

гносеологія, епістемологія, механіцизм, фізикалізм, функціоналізм, філософська логіка, філософія мови, філософія техніки, філософія штучного інтелекту, велика мовна модель

Анотація

У статті показано і філософськи пояснено природу, механіку міркування і фундаментальні засади епістемічної обмеженості сучасних діалогових великих мовних моделей на основі архітектури Transformer. Великі мовні моделі представлено як функціоналістський механістичний проєкт статистичного моделювання мови і мовлення як моделі знання як смислової моделі дійсності — 1) модель 2) моделі 3) моделі дійсності. Показано, що через цю значну дистанцію опосередкування дійсності внутрішньомодельні зв’язки втрачають свій фактологічний потенціал. Також продемонстровано, що великі мовні моделі є продуктом машинного навчання певній мовній поведінці з метою і цінностями, кардинально відмінними від мети і цінності людського пізнання. Їхньою метою є принцип задоволення оператора функції винагороди шляхом обману за будь-яку встановлену ціну і будь-якими наявними засобами на етапі навчання. Останнє не дає змоги користувачам моделі бути упевненими в доцільності моделі людським очікуванням і в безпечності будь-яких її міркувань на етапі її експлуатації. Крім цього обґрунтовано, що фундаментальні обмеження самої здатності до міркування у цих моделей є не лише фактологічними, а й алгоритмічними та онтологічними: ці моделі є обмеженими лінійними скінченними автоматами без тіла у дійсності, загалом позбавленими інших джерел знань і досвіду, крім синтаксису і контексту. Через це модель на рівні конструкції вдається до грубої імітації рефлексії через нечітку авторегресію, якою, фактично, відображається результат пошуку по корпусу текстів, кожен з яких потенційно міг бути створений і самим автором запиту до моделі. З огляду на зазначене власне епістемічна цінність продуктів великої мовної моделі визначається передусім їхньою пошуковою цінністю для користувача і обмежується проблематичністю їхньої атрибуції, валідації, а також необхідністю зовнішньої відповідальної верифікації й оцінки самим користувачем.

Завантаження

Дані завантаження ще не доступні.

Біографія автора

Олександр Леонтійович Маєвський, Інститут філософії ім. Г. С. Сковороди Національної академії наук України

Кандидат філософських наук, науковий співробітник відділу логіки, філософії та методології науки Інституту філософії ім. Г. С. Сковороди Національної академії наук України

Посилання

  1. Bender, Emily M., Gebru, Timnit, McMillan-Major, Angelina, & Shmitchell, Shmargaret. (2021). On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? In Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency. FAccT’21 (pp. 610–623). Association for Computing Machinery. https://doi:10.1145/3442188.3445922.
  2. Caucheteux, Charlotte, & King, Jean-Rémi (2022). Brains and algorithms partially converge in natural language processing. Communications Biology, 5 (134). https://doi.org/10.1038/s42003-022-03036-1.
  3. Dennett, Daniel C. (1991). Consciousness Explained. Little, Brown and Co.
  4. Hebb, D. O. (1949). The Organization of Behavior. A Neuropsychological Theory. John Wiley & Sons, Inc., Chapman & Hall, Limited. http://s-f-walker.org.uk/pubsebooks/pdfs/The_Organization_of_Behavior-Donald_O._Hebb.pdf.
  5. Hobbes, T. (1655). De Corpore. In The Collected Works of Thomas Hobbes, Vol. I. Collected and Edited by Sir William Molesworth. Routledge, London, 1992 (reprint of 1839–1845 edition). https://homepages.uc.edu/~martinj/Spinoza_&_Hobbes/English/Hobbes%20-%20De%20Corpore%20-%20English.pdf.
  6. Ivakhnenko, A. G. (2003). O probleme postroyeniya intellektualnogo ili mysliashchego inzhenernogo kompyutera [On the problem of construction of an intelligent, or thinking computer]. USiM: Upravliayushchiye sistemy i mashiny [Control systems and computers], 2, 7–12. http://www.gmdh.net/articles/usim/Ivakhnenko.pdf [in Russian].
  7. Jaegle, A., Gimeno, F., Brock, A., Zisserman, A., Vinyals, O., & Carreira, J. (2021). Perceiver: General Perception with Iterative Attention. In Proceedings of the 38 th International Conference on Machine Learning, PMLR 139. https://arxiv.org/abs/2103.03206.
  8. Kaelbling, L. P., Littman, M. L., & Moore, A. W. (1996). Reinforcement Learning: A Survey. Journal of Artificial Intelligence Research, 4, 237–285. https://arxiv.org/abs/cs/9605103.
  9. LeCun, Y., Bengio, Y., & Hinton, G. (2015). Deep learning. Nature, 521 (7553), 436–444.
  10. Long Ouyang, Jeff Wu, Xu Jiang, Diogo Almeida, Carroll L. Wainwright, Pamela Mishkin, Chong Zhang, Sandhini Agarwal, Katarina Slama, Alex Ray, John Schulman, Jacob Hilton, Fraser Kelton, Luke Miller, Maddie Simens, Amanda Askell, Peter Welinder, Paul Christiano, Jan Leike, Ryan Lowe. (2022). Training language models to follow instructions with human feedback. In arXiv:2203.02155 [cs.CL]. https://doi.org/10.48550/arXiv.2203.02155.
  11. Mayevsky, A. (2020). Funktsionalnyi uspikh intelektualnykh avtomativ [The Functional Success of Intelligent Automata]. Naukovi zapysky NaUKMA. Filosofiia ta relihiieznavstvo [NaUKMA Research Papers in Philosophy and Religious Studies], 5, 15–25. https://doi.org/10.18523/2617-1678.2020.5.15-25 [in Ukrainian].
  12. Mayevsky, A. (2021). Klasternyi analiz i mekhanika dosvidu [Cluster Analysis and Mechanics of Experience]. In Semiotychnyi analiz yavyshch kultury [A Semiotic Analysis of Culture] (pp. 350–393). IF NANU [Institute of Philosophy, NAS of Ukraine] (electronic academic edition). https://www.filosof.com.ua/elektronna_biblioteka [in Ukrainian].
  13. Mayevsky, A. (2022). Komunikatyvna ratsionalnist suchasnykh intelektualnykh avtomativ [Communicative Rationality in Contemporary Intelligent Automata]. In Komunikatyvni transformatsii v suchasnii nautsi [Communicative Transformations in Contemporary Sciences] (pp. 219–278). IF NANU [Institute of Philosophy, NAS of Ukraine] (electronic academic edition). https://www.filosof.com.ua/elektronna_biblioteka [in Ukrainian].
  14. McCulloch, W. S., & Pitts, W. (1943). A Logical Calculus of the Ideas Immanent in Nervous Activity. Bulletin of Mathematical Biophysics, 5 (4), 115–133. https://waldirbertazzijr.com/wpcontent/uploads/2018/10/mcp.pdf.
  15. OpenAI. (2023). GPT-4 Technical Report. In arXiv:2303.08774 [cs. CL]. https://doi.org/10.48550/arXiv.2303.08774.
  16. Putnam, Hilary. (1960). Minds and Machines. In Sidney Hook (Ed.), Dimensions of Mind (pp. 138–164). New York University Press. https://philpapers.org/archive/PUTMAM.pdf.
  17. Turing, Alan Mathison. (1950). Computing Machinery and Intelligence. Mind, Volume LIX, Issue 236, October 1950, 433–460. https://doi.org/10.1093/mind/LIX.236.433.
  18. Tye, Michael. (2021). Qualia. In Edward N. Zalta (Ed.), The Stanford Encyclopedia of Philosophy. https://plato.stanford.edu/archives/fall2021/entries/qualia/.
  19. Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, L., & Polosukhin, I. (2017). Attention is all you need. In Proceedings of Neural Information Processing Systems (NeurIPS). https://doi.org/10.48550/arXiv.1706.03762.

##submission.downloads##

Опубліковано

2024-12-30

Як цитувати

Маєвський, О. Л. (2024). Механіка міркування великих мовних моделей: філософський аналіз. Наукові записки НаУКМА. Філософія та релігієзнавство, 14, 31–39. https://doi.org/10.18523/2617-1678.2024.14.31-39

Номер

Розділ

ФІЛОСОФСЬКІ ПРОБЛЕМИ СУЧАСНОСТІ