TypeError: 'NoneType' object is not iterable #683

anushakabber · 2024-03-05T04:52:17Z

Traceback:
`ERROR - Traceback (most recent call last):

File "/src/Extraction.py", line 29, in get_text

paragraphs = textractor(filepath)

File "/src/txtai/pipeline/data/segmentation.py", line 68, in call

value = self.text(value)

File "/src/txtai/pipeline/data/textractor.py", line 57, in text

return self.extract(text)

File "/src/txtai/pipeline/data/textractor.py", line 117, in call

nodes.append(self.process(body))

File "/src/txtai/pipeline/data/textractor.py", line 146, in process

text = "\n".join(self.process(node) for node in children) if self.iscontainer(node, children) else self.text(node)

File "/src/txtai/pipeline/data/textractor.py", line 146, in

text = "\n".join(self.process(node) for node in children) if self.iscontainer(node, children) else self.text(node)

File "/src/txtai/pipeline/data/textractor.py", line 146, in process

text = "\n".join(self.process(node) for node in children) if self.iscontainer(node, children) else self.text(node)

TypeError: 'NoneType' object is not iterable`

The following error is being produced for certain PDFs like the one attached here. The error only showed up after updating from txtai 5.0.0 to 7.0.0. Would greatly appreciate any input on the problem. Please let me know if any further details are required.
Costco.pdf

davidmezzetti · 2024-03-05T18:55:15Z

If you're open to installing from source, please try the latest fix I just checked in.

anushakabber · 2024-03-07T14:34:50Z

Worked! Thank you!!

davidmezzetti added a commit that referenced this issue Mar 5, 2024

Fix NoneType error #683

d414864

davidmezzetti self-assigned this Mar 5, 2024

davidmezzetti added this to the v7.1.0 milestone Mar 5, 2024

davidmezzetti added the bug Something isn't working label Mar 5, 2024

anushakabber closed this as completed Mar 7, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

TypeError: 'NoneType' object is not iterable #683

TypeError: 'NoneType' object is not iterable #683

anushakabber commented Mar 5, 2024

davidmezzetti commented Mar 5, 2024

anushakabber commented Mar 7, 2024

TypeError: 'NoneType' object is not iterable #683

TypeError: 'NoneType' object is not iterable #683

Comments

anushakabber commented Mar 5, 2024

davidmezzetti commented Mar 5, 2024

anushakabber commented Mar 7, 2024