ts-bench

Reproducible benchmark CLI for comparing AI coding agents on TypeScript workloads. Numbers are directional, not lab-grade.

Interface: bun src/index.ts --help — agents, providers, --dataset v1|v2, exercises vs tasks.

Dataset	Role
v1 (default)	Exercism practice exercises
v2	SWE-Lancer (Docker, large monorepo) — run `./scripts/setup-v2-env.sh` first

Handbook (setup, secrets, CI, methodology): specs/000-project-handbook/README.md. Cursor / runner caveats: AGENTS.md. Spec Kit (SDD): .specify/, specs/; local /speckit.* commands live under .cursor/ (gitignored — run specify init --here --ai cursor-agent --force after clone).

v1 frozen baseline for reproducibility: tag v1-final → 2b3bc94. Releases

bun install
bun src/index.ts --agent claude --model <model>              # v1 default
bun src/index.ts --dataset v2 --task <id> --agent claude ...  # v2 (Docker)

Workflows: v1 · v2. SWE-Lancer task UI: bun run build:swelancer-pages then open docs/swelancer-tasks/ (see docs/README.md).

Name		Name	Last commit message	Last commit date
Latest commit History 185 Commits
.github		.github
.specify		.specify
.vscode		.vscode
data		data
docs		docs
public/data		public/data
repos		repos
scripts		scripts
specs/000-project-handbook		specs/000-project-handbook
src		src
.dockerignore		.dockerignore
.gitignore		.gitignore
.gitmodules		.gitmodules
.node-version		.node-version
AGENTS.md		AGENTS.md
CHANGELOG.md		CHANGELOG.md
Dockerfile		Dockerfile
README.md		README.md
bun.lock		bun.lock
index.ts		index.ts
package-lock.json		package-lock.json
package.json		package.json
tsconfig.json		tsconfig.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

ts-bench

About

Uh oh!

Sponsor this project

Uh oh!

Contributors

Uh oh!

Languages

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

ts-bench

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Sponsor this project

Uh oh!

Contributors

Uh oh!

Languages