Lâarticle dâApollo Research "Scheming reasoning evaluations" : https://www.apolloresearch.ai/research/scheming-reasoning-evaluations
Lâarticle dâAnthropic "Alignment faking in large language models" : https://www.anthropic.com/research/alignment-faking
Jâai ajoutĂ© le passage sur ce 2e article vraiment Ă chaud et rapidement, donc prenez tout ce que je dis avec la prudence nĂ©cessaire et jâapporterai des corrections dans un commentaire Ă©pinglĂ© si nĂ©cessaire.
Le lien vers le questionnaire pour une prochaine vidéo : https://forms.gle/SGmpmocBdkPTmPUJA
Sommaire :
0:00 - Intro
1:42 - Quâest-ce quâun agent autonome ?
4:01 - Un LLM peut-il mentir et manipuler sans quâon le lui demande ?
5:30 - 1er cas : quand o1 sâexfiltre sur un autre serveur
9:25 - Limite : contamination par la fiction et "Nothing else matters"
13:28 - 2e cas : quand o1 ment effrontément
17:02 - Sans "Nothing else matters" : un cas plus convaincant
18:58 - Un objectif long terme en prompt suffit Ă pousser Ă la manipulation
20:19 - Sans objectif long terme en prompt : les cas le plus troublants
24:20 - Sandbagging et objectif long terme acquis lors du RLHF
27:26 - Claude peut-il comprendre spontanĂ©ment quâil est testĂ© ?
29:13 - Le résultat sur le sandbagging est curieusement négligé
30:41 - Conclusion et synthĂšse
31:28 - Eh non, câest pas fini.
32:41 - Le principal rĂ©sultat de lâarticle dâAnthropic : quand Claude feint lâalignement
37:45 - Version "prompt", version "fine-tuned", version RL
42:16 - Les scrupules de Claude
44:58 - La dimension morale des valeurs que protĂšge Claude est-elle importante ?
48:08 - Conclusion de lâarticle
49:09 - Outro
______________________________
La principale source de financement de la chaĂźne est le financement participatif. Merci pour tous vos dons ! Soutenez la chaĂźne sur Patreon !
đž PATREON : https://www.patreon.com/MonsieurPhi
đž TIPEEE : https://fr.tipeee.com/monsieurphi
Ou directement via PayPal : https://www.paypal.com/paypalme/monsieurphi
đ Mon livre "CuriositĂ©s philosophiques, de Platon Ă Russell" : https://amzn.to/3KYujSo
đ§ La version en livre audio (lu par mes propres soins) est disponible sur Audible.
đ MĂ©thodo de la dissertation et de lâexplication de texte pour le bac : https://amzn.to/3c21RjE
Mes rĂ©seaux sociaux (par ordre dĂ©croissant dâactivitĂ©) :
đŹ Discord : https://discord.gg/ky8TqcHu6A
đâ Bluesky : https://bsky.app/profile/monsieurphi.bsky.social
đ Twitter : https://twitter.com/monsieurphi
đïž Twitch: https://www.twitch.tv/monsieurphi
đ· Instagram : https://www.instagram.com/monsieur.phi/
đ± Tiktok : https://www.tiktok.com/@monsieurphi
đŽ Facebook : https://www.facebook.com/graindephilo/
Autres liens
đ» PeerTube : https://indymotion.fr/video-channels/monsieur_phi/videos
đïž Replay Twitch : https://www.youtube.com/channel/UCYymKHWbYAowpzGbhE1U3tg
đ» Axiome, podcast avec LĂȘ (Science4All) : https://www.youtube.com/channel/UCNHFiyWgsnaSOsMtSoV_Q1A
Si vous voulez tester Incogni : https://incogni.com/monsieurphi
Si vous voulez en apprendre davantage sur le broicism, la vidĂ©o dâAperture "How Stoicism Became The Worldâs Greatest Scam" : https://youtu.be/h8REOHfdVZQ
Si vous voulez en apprendre davantage sur le stoĂŻcisme authentique, une interview exclusive de SĂ©nĂšque, le stoĂŻcien aux 300 millions de sesterces : https://youtu.be/iE08wLRGPcQ
Sommaire
0:00 - Préambule
0:30 - Les tableaux de JĂ©rĂŽme Bosch
2:54 - Intro + InVideo AI
6:01 - Sponso - Incogni
7:49 - Encyclopaedia of Philosophy
12:21 - StoĂŻcisme alpha
16:57 - Esthétique et thématique
19:47 - Act as if nothing bothers you (this is very powerful)
23:43 - Broicism
27:34 - Les coulisses dâune chaĂźne de stoĂŻcisme alpha
29:04 - A lack of friends indicates that
32:26 - Patient-0 et variant stoĂŻcien
36:27 - Lâalgo de recommandation et les IA gĂ©nĂ©ratives tournent en boucle
38:04 - Dead internet theory
41:29 - Conclusion
43:31 - ModĂšles autophagiques + Outro _________________________________________
La principale source de financement de la chaĂźne est le financement participatif. Merci pour tous vos dons ! Soutenez la chaĂźne sur Patreon !
đž PATREON : https://www.patreon.com/MonsieurPhi
đž TIPEEE : https://fr.tipeee.com/monsieurphi
Ou directement via PayPal : https://www.paypal.com/paypalme/monsieurphi
đ Mon livre "CuriositĂ©s philosophiques, de Platon Ă Russell" : https://amzn.to/3KYujSo
đ§ La version en livre audio (lu par mes propres soins) est disponible sur Audible.
đ MĂ©thodo de la dissertation et de lâexplication de texte pour le bac : https://amzn.to/3c21RjE
Les réseaux sociaux
đŹ Discord : https://discord.gg/ky8TqcHu6A
đ§”â Thread : https://www.threads.net/@monsieur.phi
đ€ Twitter : https://twitter.com/monsieurphi
đïž Twitch: https://www.twitch.tv/monsieurphi
đŽ Facebook : https://www.facebook.com/graindephilo/
đ± Tiktok : https://www.tiktok.com/@monsieurphi
đ· Instagram : https://www.instagram.com/monsieur.phi/
Autres liens
đ» PeerTube : https://indymotion.fr/video-channels/monsieur_phi/videos
đïž Replay Twitch : https://www.youtube.com/channel/UCYymKHWbYAowpzGbhE1U3tg
đ» Axiome, podcast avec LĂȘ (Science4All) : https://www.youtube.com/channel/UCNHFiyWgsnaSOsMtSoV_Q1A
Cette vidéo est un partenariat avec le MESEC (Mediterranean Society for Consciousness Science) : https://mesec.co/
Le gros article dont je parle tout au long de la vidéo "Consciousness in Artificial Intelligence: Insights from the Science of Consciousness" : https://arxiv.org/abs/2308.08708
Merci Ă Adrien Doerig ! Vous pouvez lire son article : "Hard criteria for empirical theories of consciousness" https://www.tandfonline.com/doi/full/10.1080/17588928.2020.1772214
Sommaire
0:00 - Intro : pourquoi ChatGPT joue le rĂŽle dâune IA dĂ©nuĂ©e de conscience ?
1:05 - Parce quâon demande aux LLM de jouer ce rĂŽle
4:46 - Le cas Blake Lemoine et le test de Turing
7:50 - Lâarticle "Consciousness in Artificial Intelligence: Insights from the Science of Consciousness"
10:53 - 1er présupposé : le fonctionnalisme
12:53 - 2e présupposé : des théories scientifiques de la conscience
15:52 - 3e présupposé : une approche chargée en théorie
17:38 - PrĂ©sentation de la Global Workplace Theory (GWT) ou thĂ©orie de lâespace de travail global
20:58 - Sur le mécanisme de sélection
23:01 - Des donnĂ©es expĂ©rimentales Ă lâappui de GWT
25:57 - Les quatre propriétés indicatives de la consciences selon GWT
27:39 - Les transformers satisfont-ils les propriétés indicatives de la conscience selon GWT ?
30:00 - Des propriĂ©tĂ©s trop faciles Ă satisfaire : lâargument des "petits rĂ©seaux"
33:54 - Le systĂšme immunitaire ou une administration sont-elles conscientes selon les critĂšres de GWT ?
36:24 - Le prĂ©sent et lâavenir des sciences de la conscience
38:21 - Hermes-3 : les crises existentielles dâun LLM
40:50 - Observer le comportement et le fonctionnement interne dâun systĂšme ne suffit plus pour Ă©carter la possibilitĂ© de la conscience
43:27 - Petite parenthĂšse sur lâinterprĂ©tabilitĂ© des LLM
45:35 - Conclusion : de lâimportance des thĂ©ories de la conscience pour dĂ©terminer si un systĂšme IA est conscient
46:58 - Outro
_________________________________________
La principale source de financement de la chaĂźne est le financement participatif. Merci pour tous vos dons ! Soutenez la chaĂźne sur Patreon !
đž PATREON : https://www.patreon.com/MonsieurPhi
đž TIPEEE : https://fr.tipeee.com/monsieurphi
Ou directement via PayPal : https://www.paypal.com/paypalme/monsieurphi
đ Mon livre "CuriositĂ©s philosophiques, de Platon Ă Russell" : https://amzn.to/3KYujSo
đ§ La version en livre audio (lu par mes propres soins) est disponible sur Audible.
đ MĂ©thodo de la dissertation et de lâexplication de texte pour le bac : https://amzn.to/3c21RjE
Les réseaux sociaux
đŹ Discord : https://discord.gg/ky8TqcHu6A
đ§”â Thread : https://www.threads.net/@monsieur.phi
đ€ Twitter : https://twitter.com/monsieurphi
đïž Twitch: https://www.twitch.tv/monsieurphi
đŽ Facebook : https://www.facebook.com/graindephilo/
đ± Tiktok : https://www.tiktok.com/@monsieurphi
đ· Instagram : https://www.instagram.com/monsieur.phi/
Autres liens
đ» PeerTube : https://indymotion.fr/video-channels/monsieur_phi/videos
đïž Replay Twitch : https://www.youtube.com/channel/UCYymKHWbYAowpzGbhE1U3tg
đ» Axiome, podcast avec LĂȘ (Science4All) : https://www.youtube.com/channel/UCNHFiyWgsnaSOsMtSoV_Q1A
Jâai concoctĂ© cette vidĂ©o dans lâurgence si bien que je nâai pas eu le temps de faire un gĂ©nĂ©rique en bon et dĂ» et forme oĂč remercier celles et ceux qui me soutiennent sur les plateformes de financement. Je le fais donc ici : MERCI vraiment, câest grĂące Ă vous que ces vidĂ©os existent.
Quelques vidéos que vous pourriez avoir envie de regarder (dont je parle à la fin):
Stupid Economics. LĂ©gislative 2024 - DĂ©mocratie, Ă©conomie : tout doit disparaĂźtre ?
https://youtu.be/mTLOPAnCiSg
Le Monde. EnquĂȘte : Cyril Hanouna et ses dĂ©rapages | RN avantagĂ© et clashs supprimĂ©s dâEurope 1
https://youtu.be/qzLSsxSmUGk
Le Tropeur. Ainsi sâĂ©teint la LibertĂ©
https://youtu.be/KatXDXgm0pQ
Blast. LĂ©gislatives : un mode de scrutin nocif
https://youtu.be/EpXajdbn2KY
Pourquoi notre systĂšme de vote est nul (et le moyen le plus simple de lâamĂ©liorer)
https://youtu.be/zmCl5i_sEiM Sommaire
0:00 - Intro
1:23 - "A votĂ©" dâIsaac Asimov - premiĂšre partie
35:57 - Quelques réflexions sur la nouvelle
39:36 - Quelques réflexions sur les élections à venir
__________________________________________
La principale source de financement de la chaĂźne est le financement participatif. Merci pour tous vos dons ! Soutenez la chaĂźne sur Patreon !
đž PATREON : https://www.patreon.com/MonsieurPhi
đž TIPEEE : https://fr.tipeee.com/monsieurphi
Ou directement via PayPal : https://www.paypal.com/paypalme/monsieurphi
đ Mon livre "CuriositĂ©s philosophiques, de Platon Ă Russell" : https://amzn.to/3KYujSo
đ§ La version en livre audio (lu par mes propres soins) est disponible sur Audible.
đ MĂ©thodo de la dissertation et de lâexplication de texte pour le bac : https://amzn.to/3c21RjE
Les réseaux sociaux
đŹ Discord : https://discord.gg/ky8TqcHu6A
đ§”â Thread : https://www.threads.net/@monsieur.phi
đ€ Twitter : https://twitter.com/monsieurphi
đïž Twitch: https://www.twitch.tv/monsieurphi
đŽ Facebook : https://www.facebook.com/graindephilo/
đ± Tiktok : https://www.tiktok.com/@monsieurphi
đ· Instagram : https://www.instagram.com/monsieur.phi/
Autres liens
đ» PeerTube : https://indymotion.fr/video-channels/monsieur_phi/videos
đïž Replay Twitch : https://www.youtube.com/channel/UCYymKHWbYAowpzGbhE1U3tg
đ» Axiome, podcast avec LĂȘ (Science4All) : https://www.youtube.com/channel/UCNHFiyWgsnaSOsMtSoV_Q1A
Si vous voulez tester Incogni : https://incogni.com/monsieurphi
Mon article de blog pour retrouver les rĂ©sultats dĂ©taillĂ©s du questionnaire (câest pas encore complĂ©tĂ© mais ça va venir) : https://monsieurphi.com/2024/06/16/enthoven-vs-chatgpt-4/
Replay du live oĂč jâai gĂ©nĂ©rĂ© les textes du questionnaire : https://youtu.be/eFHDhLtid20
Cet article sur le "faux-match" Enthoven vs. ChatGPT contient notamment les scans des copies de deux candidats : https://etudiant.lefigaro.fr/article/bac-philo-2023-qui-de-raphael-enthoven-ou-chatgpt-redige-la-meilleure-copie_a694c010-0a09-11ee-bd34-f2c2eadd1748/
La copie dâEnthoven est transcrite intĂ©gralement dans cet article de blog aussi. Si vous voulez voir Ă quoi ressemble son fameux 20/20 : https://www.pauljorion.com/blog/2024/04/01/gpt-4-et-claude-3-passent-le-bac-philo/
Sommaire
0:00 - Intro
2:57 - Sponso
4:20 - Le "faux-match" Enthoven vs. ChatGPT
6:48 - Enthoven ne connaĂźt rien Ă lâIA et ne sây intĂ©resse pas
11:30 - Interlude : "La philosophie ne fait pas de progrĂšs"
13:20 - Les sources dâEnthoven (presque rien)
16:10 - Ce quâil tire de ses sources (rien)
20:42 - "La machine est incapable dâĂ©crire une problĂ©matique"
25:48 - TrĂšs mauvais prompt, trĂšs mauvaise dissertation
28:58 - Mon test de Turing philosophique
32:36 - RĂ©sultats : attribution du texte Ă lâhumain
37:38 - Résultats : notes sur la qualité philosophique des textes
41:42 - RĂ©sultats : deux exemples de sujet
44:00 - RĂ©sultats : le sujet dâEnthoven
48:15 - Enthoven pourrait-il changer dâavis face Ă ces rĂ©sultats empiriques ?
51:29 - Le dualisme ou spiritualisme dâEnthoven
54:41 - "Les machines ne pensent pas": soit câest faux, soit câest vide.
56:08 - Conclusion et outro
__________________________________________
La principale source de financement de la chaĂźne est le financement participatif. Merci pour tous vos dons ! Soutenez la chaĂźne sur Patreon !
đž PATREON : https://www.patreon.com/MonsieurPhi
đž TIPEEE : https://fr.tipeee.com/monsieurphi
Ou directement via PayPal : https://www.paypal.com/paypalme/monsieurphi
đ Mon livre "CuriositĂ©s philosophiques, de Platon Ă Russell" : https://amzn.to/3KYujSo
đ§ La version en livre audio (lu par mes propres soins) est disponible sur Audible.
đ MĂ©thodo de la dissertation et de lâexplication de texte pour le bac : https://amzn.to/3c21RjE
Les réseaux sociaux
đŹ Discord : https://discord.gg/ky8TqcHu6A
đ§”â Thread : https://www.threads.net/@monsieur.phi
đ€ Twitter : https://twitter.com/monsieurphi
đïž Twitch: https://www.twitch.tv/monsieurphi
đŽ Facebook : https://www.facebook.com/graindephilo/
đ± Tiktok : https://www.tiktok.com/@monsieurphi
đ· Instagram : https://www.instagram.com/monsieur.phi/
Autres liens
đ» PeerTube : https://indymotion.fr/video-channels/monsieur_phi/videos
đïž Replay Twitch : https://www.youtube.com/channel/UCYymKHWbYAowpzGbhE1U3tg
đ» Axiome, podcast avec LĂȘ (Science4All) : https://www.youtube.com/channel/UCNHFiyWgsnaSOsMtSoV_Q1A
La chanson de "Brel" est ici: https://www.udio.com/songs/m8d14eYJ9wc3krcczNfrwZ
Jâai testĂ© et câest assez difficile dâobtenir exactement cette voix, je ne sais pas comment il sây est pris, mais câest clairement possible: il y a dâautres exemples de "pseudo-brel" trĂšs convaincants.
Les LLM sont nuls aux Ă©checs, il paraĂźt.
Lâarticle de Mathieu Acher sur les performances de gpt-3.5-turbo-instruct avec diverses variantes:
https://blog.mathieuacher.com/GPTsChessEloRatingLegalMoves/
Lâarticle de Nicholas Carlini sur les performances de gpt-3.5-turbo-instruct sur des puzzles dâĂ©checs.
https://nicholas.carlini.com/writing/2023/chess-llm.html
Lâarticle sur Othello-gpt: "Emergent World Representations: Exploring a Sequence Model Trained on a Synthetic Task"
https://arxiv.org/abs/2210.13382
Un article de vulgarisation au sujet dâOthello-gpt:
https://thegradient.pub/othello/
Le premier article dâAdam Karvonen : "Chess-GPTâs Internal World Model"
https://adamkarvonen.github.io/machine_learning/2024/01/03/chess-world-models.html
Son deuxiĂšme article: "Manipulating Chess-GPTâs World Model"
Lâarticle acadĂ©mique quâil en a tirĂ© : "Emergent World Models and Latent Variable Estimation in Chess-Playing Language Models"
https://arxiv.org/abs/2403.15498
Lâarticle de DeepMind "Grandmaster-Level Chess Without Search" https://arxiv.org/html/2402.04494v1 Merci Ă Infomaniak et nâhĂ©sitez pas Ă aller voir les services quâils proposent : https://infomaniak.com Sommaire
0:00 - Intro
4:56 - Sponso Infomaniak
6:16 - PremiÚres tentatives et premiÚres difficultés
10:48 - Here comes a new challenger: gpt-3.5-turbo-instruct
13:49 - Testons ça rigoureusement grùce à Mathieu Acher
20:24 - Explorons lâespace des variations possibles
26:29 - LâexpĂ©rience de Carlini sur les historiques de coups bizarres
29:28 - gpt-4 a beaucoup regressĂ© (mais nâest pas si mauvais)
33:07 - Othello-gpt, par Li et al., preuve dâune reprĂ©sentation interne du jeu
38:21 - Chess-gpt, par Adam Karvonen: encore plus impressionnant
42:38 - "Juste des perroquets stochastiques", vraiment ?
45:06 - Supplément: DeepMind entraßne un LLM à jouer à 2900 Elo
47:17 - Outro __________________________________________
La principale source de financement de la chaĂźne est le financement participatif. Merci pour tous vos dons ! Soutenez la chaĂźne sur Patreon !
đž PATREON : https://www.patreon.com/MonsieurPhi
đž TIPEEE : https://fr.tipeee.com/monsieurphi
Ou directement via PayPal : https://www.paypal.com/paypalme/monsieurphi
đ Mon livre "CuriositĂ©s philosophiques, de Platon Ă Russell" : https://amzn.to/3KYujSo
đ§ La version en livre audio (lu par mes propres soins) est disponible sur Audible.
đ MĂ©thodo de la dissertation et de lâexplication de texte pour le bac : https://amzn.to/3c21RjE
Les réseaux sociaux
đŹ Discord : https://discord.gg/ky8TqcHu6A
đ§”â Thread : https://www.threads.net/@monsieur.phi
đ€ Twitter : https://twitter.com/monsieurphi
đïž Twitch: https://www.twitch.tv/monsieurphi
đŽ Facebook : https://www.facebook.com/graindephilo/
đ± Tiktok : https://www.tiktok.com/@monsieurphi
đ· Instagram : https://www.instagram.com/monsieur.phi/
Autres liens
đ» PeerTube : https://indymotion.fr/video-channels/monsieur_phi/videos
đïž Replay Twitch : https://www.youtube.com/channel/UCYymKHWbYAowpzGbhE1U3tg
đ» Axiome, podcast avec LĂȘ (Science4All) : https://www.youtube.com/channel/UCNHFiyWgsnaSOsMtSoV_Q1A
Pour dĂ©couvrir lâentretien complet avec Nicolas Gravel, voici le lien vers la vidĂ©o sur la chaĂźne dâEchoSciences Sud Provence-Alpes-CĂŽte dâAzur : https://youtu.be/TTKTluPW3_M
VidĂ©o rĂ©alisĂ©e pour Echosciences Sud Provence-Alpes-CĂŽte dâAzur https://www.echosciences-paca.fr avec lâenseignant-chercheur en sciences Ă©conomiques Nicolas Gravel (AMSE - CNRS). Sur une idĂ©e originale de Play Azur Prod.
Vidéo coordonnée par Gulliver https://www.gulliver-sciences.fr et Play Azur Prod : https://playazur-prod.fr/.
Voir aussi : https://www.echosciences-paca.fr/articles/video-echoscientifique-n-32
Sommaire
0:00 - Présentation du "jeu" (scénario de base)
3:25 - Dilemme du prisonnier et agent rationnel
9:08 - En quoi le choix rationnel enfreint lâimpĂ©ratif catĂ©gorique de Kant
16:39 - Résultats scénario de base
21:35 - RĂ©sultats des trois variantes
27:05 - Comparaison H/F, Ăąge, situation sociale, orientation politique
29:54 - Les groupes "pour moi" croient vivre dans un autre monde
32:22 - SynthĂšse et conclusion __________________________________________
La principale source de financement de la chaĂźne est le financement participatif. Merci pour tous vos dons ! Soutenez la chaĂźne sur Patreon !
đž PATREON : https://www.patreon.com/MonsieurPhi
đž TIPEEE : https://fr.tipeee.com/monsieurphi
Ou directement via PayPal : https://www.paypal.com/paypalme/monsieurphi
đ Mon livre "CuriositĂ©s philosophiques, de Platon Ă Russell" : https://amzn.to/3KYujSo
đ§ La version en livre audio (lu par mes propres soins) est disponible sur Audible.
đ MĂ©thodo de la dissertation et de lâexplication de texte pour le bac : https://amzn.to/3c21RjE
Les réseaux sociaux
đŹ Discord : https://discord.gg/ky8TqcHu6A
đ§”â Thread : https://www.threads.net/@monsieur.phi
đ€ Twitter : https://twitter.com/monsieurphi
đïž Twitch: https://www.twitch.tv/monsieurphi
đŽ Facebook : https://www.facebook.com/graindephilo/
đ± Tiktok : https://www.tiktok.com/@monsieurphi
đ· Instagram : https://www.instagram.com/monsieur.phi/
Autres liens
đ» PeerTube : https://indymotion.fr/video-channels/monsieur_phi/videos
đïž Replay Twitch : https://www.youtube.com/channel/UCYymKHWbYAowpzGbhE1U3tg
đ» Axiome, podcast avec LĂȘ (Science4All) : https://www.youtube.com/channel/UCNHFiyWgsnaSOsMtSoV_Q1A
#shorts
Un petit rappel que les LLM sont des objets imprĂ©visibles. Si le sujet vous intĂ©resse, jây ai consacrĂ© un bon nombre de vidĂ©os mais je recommande particuliĂšrement celle-ci sur "Sydney" qui ne vous veut pas que du bien : https://youtu.be/dDhTMIao-fM
Allez donc voir la vidéo de @Trucsdephilo : https://youtu.be/Dc_rQVXB7_8
#shorts