Terminal-Bench 2.0 lansira se uz Harbor, novi okvir za testiranje agenata u spremnicima
Programeri Terminal-Bench, benchmark paketa za procjenu performansi autonomnih AI agenata na stvarnim zadacima temeljenim na terminalima, objavili su verzija 2.0 uz bok Lukanovi okvir za testiranje, poboljšanje i optimiziranje AI…