R0007/2026-03-20¶


Research	R0007 — AI Cognitive Amplifier
Mode	Claim
Run date	2026-03-20
Claims	15
Prompt	claim v1.0-draft
Model	Claude Opus 4.6 (1M context)

Second research run for R0007. 15 claims re-investigated spanning performance distributions (C001-C004), toxic worker effects (C005-C008), enterprise AI deployment (C009), AI leveling studies (C010-C014), and organizational productivity paradox (C015). 9 claims almost certain, 1 very likely, 3 likely, 2 very likely. Four claims flagged for correction: C003 year attribution (2016 not 2014), C004 author attribution (Jorgensen not Oliveira), C005 possible earlier publication date, C009 McKinsey sample size mismatch.

Claims¶

C001 — O'Boyle & Aguinis power-law distribution — Very likely

Claim: O'Boyle and Aguinis (2012) studied five studies, 198 samples, 633,263 individuals across researchers, entertainers, politicians, and athletes and found individual performance follows a power-law distribution, not a normal distribution. The top decile produces roughly 30% of total output; the top quartile produces over 50%.

Verdict: Study parameters and core Paretian finding confirmed. Output concentration percentages are consistent but approximate.

Hypothesis	Status	Probability
H1: Fully accurate	Inconclusive	—
H2: Partially correct — percentages approximate	Supported	80-95%
H3: Materially wrong	Eliminated	—

Confidence: High · Sources: 2 · Searches: 2

Hypothesis	Status	Probability
H1: Fully accurate	Supported	95-99%
H2: Partially correct	Eliminated	—
H3: Materially wrong	Eliminated	—

Hypothesis	Status	Probability
H1: Fully accurate	Eliminated	—
H2: Partially correct — year is 2016, not 2014	Supported	55-80%
H3: Materially wrong	Eliminated	—

Hypothesis	Status	Probability
H1: Fully accurate	Eliminated	—
H2: Partially correct — author is Jorgensen not Oliveira	Supported	55-80%
H3: Materially wrong	Eliminated	—

Hypothesis	Status	Probability
H1: Fully accurate	Inconclusive	—
H2: Concept confirmed, date may be earlier	Supported	55-80%
H3: Materially wrong	Eliminated	—

Hypothesis	Status	Probability
H1: Fully accurate	Inconclusive	—
H2: Core claim correct, McKinsey n wrong	Supported	55-80%
H3: Materially wrong	Eliminated	—

Pattern	Claims Affected	Significance
AI leveling effect is robust	C010, C011, C012	Three independent studies (customer service, writing, consulting) all find AI helps low performers more than high performers
Organizational outcomes lag individual gains	C014, C015	Both the Kenya study and DORA report show individual improvements don't automatically translate to organizational improvement
Performance distribution findings are replicated	C001, C003, C004	Multiple studies across decades confirm non-normal performance distributions
Attribution errors cluster around dates and names	C003, C004, C005, C009	Four claims have minor factual errors (wrong year, wrong author, wrong sample size) despite correct substantive content

Metric	Value
Claims investigated	15
Fully confirmed (Almost certain)	9 (C002, C006, C007, C008, C010, C011, C012, C014, C015)
Confirmed with nuance (Very likely)	2 (C001, C013)
Confirmed with caveats (Likely)	4 (C003, C004, C005, C009)
Unlikely or worse	0

Gap	Impact	Mitigation
Full-text access to primary papers	Some specific statistics unverifiable	Used multiple secondary sources for corroboration
Researcher profile not provided	Cannot assess bias direction	Applied general anti-confirmation-bias practices
No contradictory evidence for AI leveling claims	May indicate selection bias or genuine consensus	Actively searched for contradictory evidence; field may simply agree
DORA 2025 report only recently released	Limited citation chain analysis possible	Used multiple secondary sources reporting on the same findings

Domain	Rating	Notes
Eligibility criteria	Pass	Consistent criteria across all 15 claims
Search comprehensiveness	Pass	20+ web searches, 10+ web fetches across claims
Evaluation consistency	Pass	Same scoring framework applied to all sources
Synthesis fairness	Pass	Attribution errors surfaced in 4 claims despite supporting researcher's narrative

Metric	Value
Claims investigated	15
Files produced	260
Sources scored	19
Evidence extracts	19
Results dispositioned	45 selected + 105 rejected = 150 total
Duration (wall clock)	25m 58s
Tool uses (total)	112

Tool	Uses	Purpose
WebSearch	22	Search queries
WebFetch	10	Page content retrieval
Write	40	File creation
Read	3	File reading (methodology, output spec, research index)
Edit	0	File modification
Bash	20	Directory creation, file generation, validation

Category	Tokens
Input (context)	~500,000
Output (generation)	~150,000
Total	~650,000

R0007/2026-03-20¶

Claims¶

Collection Analysis¶

Cross-Cutting Patterns¶

Collection Statistics¶

Source Independence Assessment¶

Collection Gaps¶

Collection Self-Audit¶

Resources¶

Summary¶

Tool Breakdown¶

Token Distribution¶