refactor(tokenizer): Iterate over char codes #894

fb55 · 2021-08-04T09:53:19Z

This leads to a ~43% speed up in tokenizing performance 🤯

Old Tokenizer x 29,499 ops/sec ±0.20% (93 runs sampled)
Tokenizer x 42,260 ops/sec ±3.00% (92 runs sampled)

This leads to a ~43% speed up in tokenizing performance 🤯 ``` Old Tokenizer x 29,499 ops/sec ±0.20% (93 runs sampled) Tokenizer x 42,260 ops/sec ±3.00% (92 runs sampled) ```

refactor(tokenizer): Iterate over char codes

4f01ca0

This leads to a ~43% speed up in tokenizing performance 🤯 ``` Old Tokenizer x 29,499 ops/sec ±0.20% (93 runs sampled) Tokenizer x 42,260 ops/sec ±3.00% (92 runs sampled) ```

fb55 merged commit f5aed75 into master Aug 5, 2021

fb55 deleted the refactor/tokenzer-charcodes branch August 5, 2021 16:43

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

refactor(tokenizer): Iterate over char codes #894

refactor(tokenizer): Iterate over char codes #894

fb55 commented Aug 4, 2021

refactor(tokenizer): Iterate over char codes #894

refactor(tokenizer): Iterate over char codes #894

Conversation

fb55 commented Aug 4, 2021