π
<-

Evaluations des IA du concours de chasse au Wumpus en cours

:32tins: :32tinsktpb: :32tinsktpn: :32tinscas: :32tinstpkc: :32tinstpktpb: :32tinstp: :32tinscastp: :32tinscmc: :32tinscx: :32tinscxcas:

Evaluations des IA du concours de chasse au Wumpus en cours

Unread postby critor » 07 Nov 2013, 17:21

Nous avons reçu 10 intelligences artificielles pour notre concours de chasse au Wumpus sur TI-Nspire, de la part de:
  • AnToX98
  • compu
  • David E.
  • Extra44
  • fortytwo
  • le solutionneur
  • Max G.
  • mdr1
  • oakwood
  • zero44



Vos productions sont actuellement dans une première phase d'évaluation semi-automatisée grâce à la technologie sans-fil TI-Nspire Navigator. Vos IA se voient en effet distribuées sur un réseau sans-fil de calculatrices TI-Nspire sur lesquelles elles vont tourner pendant des heures sur plusieurs types de labygraphes.

Précisons qu'à des fins de validation chaque IA se voit testée deux fois pour chaque type de labygraphe, sur deux machines différentes - et il y a vérification que les deux machines ont bel et bien reporté des performances similaires.

Il y a actuellement 22 calculatrices que j'ai sécurisées pour cette tâche:
  • 1 TI-Nspire CX CAS munie de l'OS 3.2.4
  • 4 TI-Nspire CX CAS munies de l'OS 3.2.3
  • 2 TI-Nspire CX munies de l'OS 3.2.3
  • 15 TI-Nspire CAS TouchPad munies de l'OS 3.2.3
Image


Des captures des 22 écrans de calculatrices sont régulièrement prises de façon centralisée sans aucun besoin d'intervention individuelle sur les calculatrices:
Image




Toutefois, nous sommes au regret de vous annoncer que nous ne pourrons probablement pas vous donner les résultats cette semaine. Certes, avec 10 heures environ par type de labygraphe (pour cibler 100'000 parties), deux sessions par jour ouvrable (une en journée et une nocturne) et 4 types de labygraphes prévus pour le moment, cela aurait normalement pu être achevé pour ce week-end.

Mais d'une part, l'une des IA soumise est près de 15 fois plus lente que les autres sur de simples labygraphes à n=10 salles, et une semaine de travail supplémentaire ne lui sera pas de trop.

Et d'autre part parmi les productions reçues, quelques-unes finissent plus ou moins rapidement (après quelques dizaines ou centaines de parties) par déclencher des problèmes probablement spécifiques à certains des labygraphes générés automatiquement:
  • désactivation du mode automatique de l'interface (effet de bord avec mise à zéro de la variable mode de l'interface à laquelle il ne fallait pas toucher)
  • erreur Lua
  • boucle infinie interne (l'une des fonctions de l'IA ne renvoie jamais de réponse et continue éternellement de s'exécuter)
  • redémarrage de la machine (probablement par épuisement des ressources mémoire)

Nous souhaitons, dans la mesure du possible, classer ces IA avec les autres au nom de l'équité, au lieu de recourir à un classement de second choix sur liste complémentaire ou pire à la disqualification. En effet tout travail mérite salaire, et nous souhaitons donc que chaque participant ayant fait des efforts reçoive son pourcentage d'efficacité ayant même valeur que celui des autres.

Aussi, il nous faut du temps pour analyser ces IA problématiques et les corriger.
Nous ne corrigeons pas afin de rendre le code meilleur, mais uniquement afin de le rendre évaluable. Toute éventuelle correction de notre part consiste en l'application d'une pénalité (abandon de la partie courante qui sera comptée comme une partie perdue) *avant* que le problème ne se déclenche.

Les deux premiers points cités ci-dessus ont déjà été corrigés puisqu'il s'agissait de problèmes mineurs:
  • remplacement de la ligne "mode=0" qui désactivait le mode automatique de l'interface par une ligne "forfeit=true" faisant perdre la partie courante
  • passage à une version 4 de l'interface avec un gestionnaire d'erreurs - ce dernier intercepte toutes les erreurs Lua déclenchées dans les fonctions de l'IA et provoque l'abandon de la partie courante avec "forfeit=true", ce qui permet le passage de l'interface à la partie suivante et donc la réinitialisation de l'IA

Les deux derniers points risquent de nous causer davantage de problèmes et de nous prendre plus de temps. Il nous faudrait idéalement achever leur correction ce week-end, afin de pouvoir terminer l'évaluation la semaine prochaine.


A bientôt ;)
Image
User avatar
critorAdmin
Niveau 19: CU (Créateur Universel)
Niveau 19: CU (Créateur Universel)
Level up: 48%
 
Posts: 41980
Images: 15887
Joined: 25 Oct 2008, 00:00
Location: Montpellier
Gender: Male
Calculator(s):
MyCalcs profile
YouTube: critor3000
Twitter: critor2000
GitHub: critor

Re: Evaluations des IA du concours de chasse au Wumpus en co

Unread postby AnToX98 » 07 Nov 2013, 17:30

Et bien, 10 participations, au moins, il y en aura pour tout le monde :P

Des captures des 22 écrans de calculatrices sont régulièrement prises de façon centralisée sans aucun besoin d'intervention individuelle sur les calculatrices:


Impressionnant, je ne savais pas que c'était possible de montrer ce que chaque calculatrice voyait via le Teacher Software, une vraie prouesse :bj:

Toutefois, nous sommes au regret de vous annoncer que nous ne pourrons probablement pas vous donner les résultats cette semaine. Certes, avec 10 heures environ par type de labygraphe (pour cibler 100'000 parties), deux sessions par jour ouvrable (une en journée et une nocturne) et 4 types de labygraphes prévus pour le moment, cela aurait normalement pu être achevé pour ce week-end.


C'est pas du tout grave. Il vaut mieux prendre son temps et évaluer avec équité ces IA plutôt que faire ça à l'arrache :)
User avatar
AnToX98Premium
Niveau 14: CI (Calculateur de l'Infini)
Niveau 14: CI (Calculateur de l'Infini)
Level up: 75.5%
 
Posts: 1022
Images: 15
Joined: 19 May 2013, 16:54
Location: Paris, France
Gender: Male
Calculator(s):
MyCalcs profile
Class: 1ere S

Re: Evaluations des IA du concours de chasse au Wumpus en co

Unread postby Hayleia » 07 Nov 2013, 17:40

AnToX98 wrote:
Toutefois, nous sommes au regret de vous annoncer que nous ne pourrons probablement pas vous donner les résultats cette semaine. Certes, avec 10 heures environ par type de labygraphe (pour cibler 100'000 parties), deux sessions par jour ouvrable (une en journée et une nocturne) et 4 types de labygraphes prévus pour le moment, cela aurait normalement pu être achevé pour ce week-end.


C'est pas du tout grave. Il vaut mieux prendre son temps et évaluer avec équité ces IA plutôt que faire ça à l'arrache :)

Je suis d'accord. Mieux vaut attendre une semaine pour des résultats sérieux et mérités plutôt que d'attendre une semaine pour finalement se rendre compte que les résultats ont été tirés au hasard et que certains gagnants ont un prix qu'ils ne méritent pas (en prenant une photo de sa calculatrice sur un tapis) tandis que d'autres méritaient mieux que ce qu'ils ont (la photo d'AnToX98 méritait une CX CAS Ndlessable).
Je félicite donc les organisateurs de ce concours pour leur sérieux, même si je n'y participe pas.

Image
ImageImageImage
Pokemon Topaze (Axe) discussion and download links here
(19:29:36) noelnadal: plus sérieusemen​t, j'ai très peu de problèmes
(22:45:44) Clifward: J'aime rire du malheur des autres :troll:

(2017.11.18 - 17:07:12) Fireworks: Hayleia !!!!!
(2017.11.18 - 17:07:19) TI-Bot: Fireworks has been logged out (Kicked).
(2017.11.18 - 17:07:22) TI-Bot: Ban of user Fireworks revoked.
(2017.11.18 - 17:07:25) TI-Bot: Fireworks logs into the Chat.
(2017.11.18 - 17:07:28) Fireworks: <3
(2017.11.18 - 17:07:31) Fireworks: 208
User avatar
HayleiaGénéreux
Niveau 17: GM (Grand Maître des calculatrices)
Niveau 17: GM (Grand Maître des calculatrices)
Level up: 43.8%
 
Posts: 2509
Images: 2
Joined: 30 Aug 2011, 08:22
Gender: Not specified
Calculator(s):
MyCalcs profile
Class: Templar

Re: Evaluations des IA du concours de chasse au Wumpus en co

Unread postby critor » 07 Nov 2013, 18:07

@Hayleia: merci pour ta remarque qui nous va droit au coeur! ;)

AnToX98 wrote:
Des captures des 22 écrans de calculatrices sont régulièrement prises de façon centralisée sans aucun besoin d'intervention individuelle sur les calculatrices:


Impressionnant, je ne savais pas que c'était possible de montrer ce que chaque calculatrice voyait via le Teacher Software, une vraie prouesse :bj:


Il faut plus que le TI-Nspire Teacher Software en fait.
Il faut le TI-Nspire Navigator Software - c'est en réalité un Teacher Software étendu de nombre d'onglets pour gérer les classes et réseaux de TI-Nspire.
Il est téléchargeable sur notre site, mais il n'y a pas de période d'essai. Si tu n'as pas de licence valide, tu ne verras rien.
Image
User avatar
critorAdmin
Niveau 19: CU (Créateur Universel)
Niveau 19: CU (Créateur Universel)
Level up: 48%
 
Posts: 41980
Images: 15887
Joined: 25 Oct 2008, 00:00
Location: Montpellier
Gender: Male
Calculator(s):
MyCalcs profile
YouTube: critor3000
Twitter: critor2000
GitHub: critor

Re: Evaluations des IA du concours de chasse au Wumpus en co

Unread postby mdr1 » 07 Nov 2013, 18:53

Merci infiniment critor pour le mal que tu t'es donné à préparer le concours, encourager les gens à participer, et enfin que tu te donnes pour évaluer les IA de la manière la plus juste possible. Et deux semaines, je trouve cela extrêmement rapide, comparé à certains autres concours. Il n'y a donc aucune excuse à faire. Bref, merci pour ce concours, malgré les quelques soucis qu'il y a pu avoir et le fait que le nombre de participants n'en est pas à la hauteur. Et en plus, il est très appréciable d'être prévenu en temps réel de l'état d'avancement de l'évaluation. :bj:
Image ImageImage
User avatar
mdr1Premium
Niveau 14: CI (Calculateur de l'Infini)
Niveau 14: CI (Calculateur de l'Infini)
Level up: 44%
 
Posts: 1083
Images: 12
Joined: 28 Mar 2011, 00:00
Gender: Not specified
Calculator(s):
MyCalcs profile
Class: Je voyage toujours en première.

Re: Evaluations des IA du concours de chasse au Wumpus en co

Unread postby AnToX98 » 07 Nov 2013, 18:56

Je suis totalement en accord avec mdr1 et Hayleia : Il faudra que tu nous en organises d'autres des concours comme ça :bj:
User avatar
AnToX98Premium
Niveau 14: CI (Calculateur de l'Infini)
Niveau 14: CI (Calculateur de l'Infini)
Level up: 75.5%
 
Posts: 1022
Images: 15
Joined: 19 May 2013, 16:54
Location: Paris, France
Gender: Male
Calculator(s):
MyCalcs profile
Class: 1ere S

Re: Evaluations des IA du concours de chasse au Wumpus en co

Unread postby mdr1 » 07 Nov 2013, 19:01

AnToX98 wrote:Je suis totalement en accord avec mdr1 et Hayleia : Il faudra que tu nous en organises d'autres des concours comme ça :bj:

Je ne crois pas avoir rien dit de tel. Les concours de critor sont véritablement géniaux, mais il a dit qu'il ne s'occuperait pas du prochain concours. Je ne le forcerai en rien moralement, il a déjà dépensé beaucoup d'énergie pour des concours précédents qui ont eu un succès insuffisant par rapport à celui qu'ils méritaient, et il me semble donc logique qu'il puisse se reposer et penser un peu à lui-même après ce dur labeur. ;)
Image ImageImage
User avatar
mdr1Premium
Niveau 14: CI (Calculateur de l'Infini)
Niveau 14: CI (Calculateur de l'Infini)
Level up: 44%
 
Posts: 1083
Images: 12
Joined: 28 Mar 2011, 00:00
Gender: Not specified
Calculator(s):
MyCalcs profile
Class: Je voyage toujours en première.

Re: Evaluations des IA du concours de chasse au Wumpus en co

Unread postby AnToX98 » 07 Nov 2013, 19:05

Pardon, je me suis mal exprimé. Je suis d'accord dans le fait du remerciement de critor pour l'organisation de ce concours. Après j'espère juste qu'on en retrouvera d'autres comme celui-ci (je ne dis pas que j'en veux d'autres demain ou dans une semaine, mais dans les années à venir :) ). Parce que les concours plus "libres" c'est bien, mais ça devient vite lassant :)
User avatar
AnToX98Premium
Niveau 14: CI (Calculateur de l'Infini)
Niveau 14: CI (Calculateur de l'Infini)
Level up: 75.5%
 
Posts: 1022
Images: 15
Joined: 19 May 2013, 16:54
Location: Paris, France
Gender: Male
Calculator(s):
MyCalcs profile
Class: 1ere S

Re: Evaluations des IA du concours de chasse au Wumpus en co

Unread postby Adriweb » 07 Nov 2013, 19:07

En gros, on alterne un peu, le prochain (vers Noel), je vais m'en occuper un peu plus. ( Ca sera un concours plus grand public que d'habitude, pour varier, d'ailleurs :) )
Et celui d'après encore, on l'a déjà préparé globalement :)

MyCalcs: Help the community's calculator documentations by filling out your calculators info!
MyCalcs: Aidez la communauté à documenter les calculatrices en donnant des infos sur vos calculatrices !
Inspired-Lua.org: All about TI-Nspire Lua programming (tutorials, wiki/docs...)
My calculator programs
Mes programmes pour calculatrices
User avatar
AdriwebAdmin
Niveau 16: CC2 (Commandeur des Calculatrices)
Niveau 16: CC2 (Commandeur des Calculatrices)
Level up: 78.9%
 
Posts: 14744
Images: 1119
Joined: 01 Jun 2007, 00:00
Location: France
Gender: Male
Calculator(s):
MyCalcs profile
Twitter: adriweb
GitHub: adriweb

Re: Evaluations des IA du concours de chasse au Wumpus en co

Unread postby nikitouzz » 07 Nov 2013, 19:24

Adriweb un jeu en rapport avec noel :D

Bon concours meme si je n'ai pu participer a cause du fait que je ne programme qu'en axe :)
Mes records personnels :
2x2x2 : 2.18 secondes / 2x2x2 une main : 21.15 secondes / 2x2x2 yeux bandés : 47.59
3x3x3 : 5.97 secondes / 3x3x3 une main : 49.86 secondes
4x4x4 : 1.49 minutes / 4x4x4 une main : 6.50 minutes
5x5x5 : 4.10 minutes / 5x5x5 une main : 18.02 minutes
6x6x6 : 8.10 minutes
7x7x7 : 16.03 minutes
9x9x9 : 58.26 minutes

megaminx : 5.59 minutes / pyraminx : 7.91 secondes / square-one : 1.07 minutes

Image
User avatar
nikitouzzModo
Niveau 16: CC2 (Commandeur des Calculatrices)
Niveau 16: CC2 (Commandeur des Calculatrices)
Level up: 42.7%
 
Posts: 1016
Images: 1
Joined: 16 Feb 2012, 18:39
Gender: Male
Calculator(s):
MyCalcs profile
Class: Fac de maths

Next

Return to News TI-Nspire

Who is online

Users browsing this forum: ClaudeBot [spider] and 17 guests

-
Search
-
Social TI-Planet
-
Featured topics
Comparaisons des meilleurs prix pour acheter sa calculatrice !
"1 calculatrice pour tous", le programme solidaire de Texas Instruments. Reçois gratuitement et sans aucune obligation d'achat, 5 calculatrices couleur programmables en Python à donner aux élèves les plus nécessiteux de ton lycée. Tu peux recevoir au choix 5 TI-82 Advanced Edition Python ou bien 5 TI-83 Premium CE Edition Python.
Enseignant(e), reçois gratuitement 1 exemplaire de test de la TI-82 Advanced Edition Python. À demander d'ici le 31 décembre 2024.
Aidez la communauté à documenter les révisions matérielles en listant vos calculatrices graphiques !
1234
-
Donations / Premium
For more contests, prizes, reviews, helping us pay the server and domains...
Donate
Discover the the advantages of a donor account !
JoinRejoignez the donors and/or premium!les donateurs et/ou premium !


Partner and ad
Notre partenaire Jarrety Calculatrices à acheter chez Calcuso
-
Stats.
940 utilisateurs:
>896 invités
>36 membres
>8 robots
Record simultané (sur 6 mois):
6892 utilisateurs (le 07/06/2017)
-
Other interesting websites
Texas Instruments Education
Global | France
 (English / Français)
Banque de programmes TI
ticalc.org
 (English)
La communauté TI-82
tout82.free.fr
 (Français)