π
<-

Résultats du grand concours de chasse au Wumpus

:32tins: :32tinsktpb: :32tinsktpn: :32tinscas: :32tinstpkc: :32tinstpktpb: :32tinstp: :32tinscastp: :32tinscmc: :32tinscx: :32tinscxcas:
Online

Re: Résultats du grand concours de chasse au Wumpus

Unread postby Lionel Debroux » 18 Nov 2013, 20:00

mdr1: critor, Adriweb et Levak ont en effet, comme ils l'ont expliqué en détail (ça serait resté entre admins de TI-Planet si tu n'avais pas sur-réagi et qu'ils aient dû se défendre), passé beaucoup de temps à tenter de faire fonctionner ton IA dysfonctionnelle, de manière à pouvoir l'évaluer aussi justement que possible (je te rappelle que tu fais partie de ceux qui avaient félicité critor de prendre du temps pour faire une évaluation la plus juste possible).
Bref, estime-toi heureux d'être 6ème et non dernier, derrière TI-Bot... oui, car même l'IA aléatoire fait quelque chose sur les graphes plus grands, et pour l'IA aléatoire, il n'avait pas fallu modifier le code d'évaluation pour que ton algorithme puisse s'exécuter (ce qui t'aurait valu un zéro pointé dans nombre de concours, à n'en pas douter).
Ton comportement en réaction à l'annonce des résultats est vraiment décevant, et très certainement démotivant pour critor, Levak et Adriweb...

Extra44 fait bien de rappeler les règles qui ont été là dès le départ. Nous avons évalué, comme annoncé dès le départ, avec le premier critère sur le taux de réussite, et le deuxième critère (pour départager d'éventuels ex-aequo) sur le nombre moyen de coups.
Membre de la TI-Chess Team.
Co-mainteneur de GCC4TI (documentation en ligne de GCC4TI), TIEmu et TILP.
User avatar
Lionel DebrouxSuper Modo
Niveau 14: CI (Calculateur de l'Infini)
Niveau 14: CI (Calculateur de l'Infini)
Level up: 11.3%
 
Posts: 6865
Joined: 23 Dec 2009, 00:00
Location: France
Gender: Male
Calculator(s):
MyCalcs profile
Class: -
GitHub: debrouxl

Re: Résultats du grand concours de chasse au Wumpus

Unread postby critor » 18 Nov 2013, 20:09

Levak wrote:
mdr1 wrote: Et l'option d'un émulateur à faire fonctionner en vitesse fois 2000% aurait tout à fait été envisageable, pour évaluer mon IA avec du 30. Sans compter que les règles ne précisaient nulle part que l'IA devait être optimisée en vitesse

Ça a été le cas, hein, pour le_solutionneur et toi-même sur lesquels nous avons dû lancer vos algos sur des i7 qui tournaient toute la nuit à 90°C (car un script faisait bouger la souris pour aller plus vite). C'était déjà un très beau geste de notre part de sacrifier ces machines pendant 2-3 jours alors que toutes les autres IA tournaient sans problème oncalc (cf les clusters de Critor).
Donc estimes toi déjà heureux de pas avoir eu 0 à tous les graphes excepté le premier.


Concernant le solutionneur, le problème venait des fonctions de debug (print):
- sur le logiciel, les print ralentissent énormément
- sur calculatrice normalement non, mais leurs paramètres, dans son cas de monstrueux tableaux, sont quand même évalués.

Nous avons simplement commenté toutes ces instructions, afin de rendre cette IA évaluable sans en changer le fonctionnement interne.


Concernant mdr1, c'est bien le code interne à l'IA qui est défectueux et a une consommation exponentielle de la mémoire.
Le modifier pour nous, c'est faire le travail du candidat à sa place... donc, non.
Image
User avatar
critorAdmin
Niveau 19: CU (Créateur Universel)
Niveau 19: CU (Créateur Universel)
Level up: 48%
 
Posts: 41981
Images: 15887
Joined: 25 Oct 2008, 00:00
Location: Montpellier
Gender: Male
Calculator(s):
MyCalcs profile
YouTube: critor3000
Twitter: critor2000
GitHub: critor

Re: Résultats du grand concours de chasse au Wumpus

Unread postby critor » 18 Nov 2013, 20:15

@Mdr1: je puis comprendre que tu sois déçu.

Mais comme dit plus haut, on a déjà du littéralement se battre *contre* ton IA afin de pouvoir l'évaluer.
Elle a fait l'objet d'un traitement particulier de notre part, je dirais même à la limite du privilégié.

On s'est cassé la tête dessus pendant des heures en plus du temps machine.



Nous ne pouvions pas faire mieux que ça.

Tente toi-même de la faire tourner telle que publiée sur une machine overclockée munie de beaucoup de SDRAM sur l'émulateur ou le logiciel TI-Nspire, et fournis-nous une capture de centaines de milliers de parties (comme les autres) en n=20 si tu en es capable.

On attend ;)

En théorie, tu auras besoin de plusieurs semaines ou même mois... En pratique, le logiciel ou l'émulateur planteront bien avant.
Image
User avatar
critorAdmin
Niveau 19: CU (Créateur Universel)
Niveau 19: CU (Créateur Universel)
Level up: 48%
 
Posts: 41981
Images: 15887
Joined: 25 Oct 2008, 00:00
Location: Montpellier
Gender: Male
Calculator(s):
MyCalcs profile
YouTube: critor3000
Twitter: critor2000
GitHub: critor

Online

Re: Résultats du grand concours de chasse au Wumpus

Unread postby Lionel Debroux » 18 Nov 2013, 20:36

mdr1, je te laisse nous présenter publiquement tes excuses pour la façon dont tu as réagi à ce topic :)
Par ailleurs, je t'invite (mais je ne t'oblige pas) à nous montrer cette fameuse IA à 95% de réussite que tu as mentionnée dans l'autre topic. Bien sûr, il faut la débarrasser du problème d'implémentation qui fait ralentir et crasher l'interpréteur Lua.
Membre de la TI-Chess Team.
Co-mainteneur de GCC4TI (documentation en ligne de GCC4TI), TIEmu et TILP.
User avatar
Lionel DebrouxSuper Modo
Niveau 14: CI (Calculateur de l'Infini)
Niveau 14: CI (Calculateur de l'Infini)
Level up: 11.3%
 
Posts: 6865
Joined: 23 Dec 2009, 00:00
Location: France
Gender: Male
Calculator(s):
MyCalcs profile
Class: -
GitHub: debrouxl

Re: Résultats du grand concours de chasse au Wumpus

Unread postby critor » 18 Nov 2013, 20:42

Lionel Debroux wrote:mdr1, je te laisse nous présenter publiquement tes excuses pour la façon dont tu as réagi à ce topic :)
Par ailleurs, je t'invite (mais je ne t'oblige pas) à nous montrer cette fameuse IA à 95% de réussite que tu as mentionnée dans l'autre topic. Bien sûr, il faut la débarrasser du problème d'implémentation qui fait ralentir et crasher l'interpréteur Lua.


Aucune IA ne franchit la barre des 90% après convergence sur plusieurs centaines de milliers de parties.

Sur un échantillon de parties trop faible quand il n'y a pas encore eu convergence (quelques centaines, milliers, voir dizaines de milliers de parties), il est bien évidemment possible et normal d'avoir un pourcentage plus grand ou plus petit de quelques unités par rapport à la valeur théorique finale.
Image
User avatar
critorAdmin
Niveau 19: CU (Créateur Universel)
Niveau 19: CU (Créateur Universel)
Level up: 48%
 
Posts: 41981
Images: 15887
Joined: 25 Oct 2008, 00:00
Location: Montpellier
Gender: Male
Calculator(s):
MyCalcs profile
YouTube: critor3000
Twitter: critor2000
GitHub: critor

Re: Résultats du grand concours de chasse au Wumpus

Unread postby AnToX98 » 18 Nov 2013, 20:51

Je trouve aussi que c'est un peu méchant, surtout que moi j'ai du bosser moins de 4 heures sur ce concours, alors que mdr1, comme il le dit, s'est penché dessus pendant plusieurs jours. Il mérite donc plus la 5ème place que moi.
User avatar
AnToX98Premium
Niveau 14: CI (Calculateur de l'Infini)
Niveau 14: CI (Calculateur de l'Infini)
Level up: 75.5%
 
Posts: 1022
Images: 15
Joined: 19 May 2013, 16:54
Location: Paris, France
Gender: Male
Calculator(s):
MyCalcs profile
Class: 1ere S

Online

Re: Résultats du grand concours de chasse au Wumpus

Unread postby Lionel Debroux » 18 Nov 2013, 20:59

Ce qui est fait est fait, mais sa réaction inappropriée m'a convaincu qu'il mériterait plutôt la 12ème place en fin de compte.
Il fait un programme qui ne fonctionne tellement pas qu'il faut modifier le code d'évaluation spécialement pour lui, il faut faire tourner les machines et le computer software pendant des jours pour tenter de l'évaluer quand même... et malgré ça, quand le résultat ne correspond pas à ses attentes (ce qu'on peut comprendre, il y avait passé du temps et pensait avoir fait quelque chose de bien), il trouve le moyen de se plaindre d'être au milieu du classement (grâce au fait que quand il fonctionne, son algorithme donne de bons résultats), déclenchant ainsi la publication d'éléments bien plus détaillés que prévu sur les raisons qui ont pénalisé son programme (on ne cherche pas à enfoncer les candidats dans les annonces de résultats, question d'éthique). Il ne faut pas exagérer.

Dans l'organisation des concours, nous essayons de tirer parti du retour d'expérience. J'imagine que la prochaine fois qu'on fait un concours d'algorithmie, il faudra être encore plus clair sur certains points. Par exemple, le fait que les soumissions doivent pouvoir être évaluées avec le logiciel d'évaluation prévu (ça n'empêche pas de reporter des problèmes avant, comme ça a été le cas cette fois-ci, et nous en remercions les candidats), sans modifications, et que les "juges" pénaliseront à leur guise les programmes qui ne respectent pas cette règle ?
Membre de la TI-Chess Team.
Co-mainteneur de GCC4TI (documentation en ligne de GCC4TI), TIEmu et TILP.
User avatar
Lionel DebrouxSuper Modo
Niveau 14: CI (Calculateur de l'Infini)
Niveau 14: CI (Calculateur de l'Infini)
Level up: 11.3%
 
Posts: 6865
Joined: 23 Dec 2009, 00:00
Location: France
Gender: Male
Calculator(s):
MyCalcs profile
Class: -
GitHub: debrouxl

Re: Résultats du grand concours de chasse au Wumpus

Unread postby critor » 18 Nov 2013, 21:05

Je trouve le mot 'méchant' fort inapproprié ici.
Si on est méchant avec tout ce que l'on a bataillé pour évaluer son IA défectueuse...



Tu as fourni une IA qui a marché direct, et résout tous les types de problèmes qu'on lui soumet.

Mdr1 a fournit une IA que l'on a dû corriger (même si il n'a pas été pénalisé pour ça), qui s'en sort certes mieux que toi en n=10 mais qui explose la mémoire de l'ordinateur sur n=20 et n=30.
Donc le 0% sur ces types de graphes est mérité - et on a bien dit dès le départ que l'on testerait au delà de n=10.


Lui mettre un score supposé autre que 0% sur ces graphes, c'est ça qui aurait été totalement inéquitable et injuste par rapport aux autres candidats.

Car si vous regardez bien le diagramme, certaines IA se croisent en performances quand on augmente la difficulté.
Mdr1 aurait-il donc fait en n=20 pareil, mieux ou mieux bien?

Personne ne le sait, et comme son code consomme exponentiellement la mémoire, il faudrait disposer d'un temps infini et d'une machine à mémoire infinie pour l'évaluer.


Il n'y a ici aucune méchanceté, juste le soucis d'être justes et équitables.
Malgré tout le respect et l'estime que nous avions envers mdr1, nous ne l'avons pas avantagé dans les scores. Nous étions d'ailleurs fort déçus de sa production - il était capable de faire bien mieux que ça.

Après, si tu veux échanger ton lot avec le sien, ça te regarde et tu te débrouilles avec lui.
Image
User avatar
critorAdmin
Niveau 19: CU (Créateur Universel)
Niveau 19: CU (Créateur Universel)
Level up: 48%
 
Posts: 41981
Images: 15887
Joined: 25 Oct 2008, 00:00
Location: Montpellier
Gender: Male
Calculator(s):
MyCalcs profile
YouTube: critor3000
Twitter: critor2000
GitHub: critor

Re: Résultats du grand concours de chasse au Wumpus

Unread postby AnToX98 » 18 Nov 2013, 21:10

Oui du point de vue sentimental, c'est injuste, mais du point de vue du concours, c'est totalement juste.
User avatar
AnToX98Premium
Niveau 14: CI (Calculateur de l'Infini)
Niveau 14: CI (Calculateur de l'Infini)
Level up: 75.5%
 
Posts: 1022
Images: 15
Joined: 19 May 2013, 16:54
Location: Paris, France
Gender: Male
Calculator(s):
MyCalcs profile
Class: 1ere S

Re: Résultats du grand concours de chasse au Wumpus

Unread postby critor » 18 Nov 2013, 21:14

Si il a passé plus de temps que toi pour produire un code moins bon, je n'y peux strictement rien.


Là, tu touches la frontière philosophique entre l'égalité et l'équité - c'est bien ;)

Un "concours" n'est pas un examen. Son but est donc d'être équitable et non égalitaire.
Image
User avatar
critorAdmin
Niveau 19: CU (Créateur Universel)
Niveau 19: CU (Créateur Universel)
Level up: 48%
 
Posts: 41981
Images: 15887
Joined: 25 Oct 2008, 00:00
Location: Montpellier
Gender: Male
Calculator(s):
MyCalcs profile
YouTube: critor3000
Twitter: critor2000
GitHub: critor

PreviousNext

Return to News TI-Nspire

Who is online

Users browsing this forum: ClaudeBot [spider] and 29 guests

-
Search
-
Social TI-Planet
-
Featured topics
Comparaisons des meilleurs prix pour acheter sa calculatrice !
"1 calculatrice pour tous", le programme solidaire de Texas Instruments. Reçois gratuitement et sans aucune obligation d'achat, 5 calculatrices couleur programmables en Python à donner aux élèves les plus nécessiteux de ton lycée. Tu peux recevoir au choix 5 TI-82 Advanced Edition Python ou bien 5 TI-83 Premium CE Edition Python.
Enseignant(e), reçois gratuitement 1 exemplaire de test de la TI-82 Advanced Edition Python. À demander d'ici le 31 décembre 2024.
Aidez la communauté à documenter les révisions matérielles en listant vos calculatrices graphiques !
1234
-
Donations / Premium
For more contests, prizes, reviews, helping us pay the server and domains...
Donate
Discover the the advantages of a donor account !
JoinRejoignez the donors and/or premium!les donateurs et/ou premium !


Partner and ad
Notre partenaire Jarrety Calculatrices à acheter chez Calcuso
-
Stats.
898 utilisateurs:
>882 invités
>9 membres
>7 robots
Record simultané (sur 6 mois):
6892 utilisateurs (le 07/06/2017)
-
Other interesting websites
Texas Instruments Education
Global | France
 (English / Français)
Banque de programmes TI
ticalc.org
 (English)
La communauté TI-82
tout82.free.fr
 (Français)