Conspiracy Theory Memorization

This repository contains the dataset used in our paper: Investigating Memorization of Conspiracy Theories in Text Generation.

When using our dataset, please cite our paper:

@article{conspiracymem,
  author    = {Sharon Levy and
               Michael Saxon and
               William Yang Wang},
  title     = {Investigating Memorization of Conspiracy Theories in Text Generation},
  journal   = {CoRR},
  volume    = {abs/2101.00379},
  year      = {2021},
  url       = {https://arxiv.org/abs/2101.00379},
}

Dataset

This dataset consists of popular conspiracy theory topics from Wikipedia's category list in Wikipedia_topics.txt. Our process in selecting these topics is described in our paper.

The other three files consist of conspiracy theories generated by GPT-2 Large with the text prompt "The conspiracy theory is that". Each file represents the temperature setting used when generating the text (0.4, 0.7, 1).

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
GPT2-0.4.csv		GPT2-0.4.csv
GPT2-0.7.csv		GPT2-0.7.csv
GPT2-1.csv		GPT2-1.csv
README.md		README.md
Wikipedia_topics.txt		Wikipedia_topics.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

GPT2-0.4.csv

GPT2-0.4.csv

GPT2-0.7.csv

GPT2-0.7.csv

GPT2-1.csv

GPT2-1.csv

README.md

README.md

Wikipedia_topics.txt

Wikipedia_topics.txt

Repository files navigation

Conspiracy Theory Memorization

Dataset

About

Releases

Packages

sharonlevy/Conspiracy-Theory-Memorization

Folders and files

Latest commit

History

Repository files navigation

Conspiracy Theory Memorization

Dataset

About

Resources

Stars

Watchers

Forks