## Python如何一边遍历列表一边删除数据

### list.remove(obj)方法的问题

现在有一个list，如何实现一边遍历列表一边删除元素。最容易想到的方法如下：

In [1]:
a = [1,2,3,4,5,6]
for i in a:
    print(i)
    a.remove(i)
    print(a)

1
[2, 3, 4, 5, 6]
3
[2, 4, 5, 6]
5
[2, 4, 6]


In [2]:

test = 'aaooobbooccodd'
print(test.split('o'))


[2, 4, 6]


最后的结果应该是空的列表，但是实际结果是每隔一个元素删除一个元素，这是为什么？

In [4]:
a = [1,2,3,4,5,6]

times = 1
index = 0
for data in a:
    print('这是第{}次循环，当前下标值为{}，删除前列表元素{}'.format(times,index,a))
    print('要删除的元素{}'.format(data))
    a.remove(data)
    times += 1
    index += 1

print('循环结束，最后列表元素{}'.format(a))

这是第1次循环，当前下标值为0，删除前列表元素[1, 2, 3, 4, 5, 6]
要删除的元素1
这是第2次循环，当前下标值为1，删除前列表元素[2, 3, 4, 5, 6]
要删除的元素3
这是第3次循环，当前下标值为2，删除前列表元素[2, 4, 5, 6]
要删除的元素5
循环结束，最后列表元素[2, 4, 6]


原因是当遍历第一个元素时，删除了下标为0的元素，当遍历下标为1的元素时，后面的元素会向前移动一个位置，就是元素2移动到了原来元素1的位置，但是此时已经准备删除下标为1的元素，这样就将元素2跳过去了，以此类推，所有偶数元素都没有被删除。

为什么循环了3次就停了？

从data中取出元素也是依据 index, 
- 第一次index=0,取出1;
- 第二次 index=1,取出3(因为整个列表向前移动了一位)；
- 第三次 index=2,取出5；
- 第四次 index=3,列表[1,4,6] 不够取了，内部报错，停止。

#### 解决办法
新建一个相同的临时列表，用for循环临时列表，删除原列表中的元素！

In [4]:
a = [1,2,3,4,5,6]
b = a[:]

for i in b:
    print(i)
    a.remove(i)
    print(a)

1
[2, 3, 4, 5, 6]
2
[3, 4, 5, 6]
3
[4, 5, 6]
4
[5, 6]
5
[6]
6
[]


#### 解决办法

从后往前删除

In [13]:
a = [1,2,3,4,5,6]

for i in range(len(a)-1,-1,-1):
    print('要删除的元素{}'.format(a[i]))
    a.remove(a[i])

print('循环结束，最后列表元素{}'.format(a))

要删除的元素6
要删除的元素5
要删除的元素4
要删除的元素3
要删除的元素2
要删除的元素1
循环结束，最后列表元素[]


### 去除列表当中的换行符

通常情况下会出现在爬虫中，爬取到的 html 中有大量换行符，格式不是很美观

In [9]:
list1 = ['\n   \n', '\n', '\n 浔阳江头夜送客，枫叶荻花秋瑟瑟。','\n   \n 。主人下马客在船，举酒欲饮无管弦。\n\n', '醉不成欢惨将别，别时茫茫江浸月\n', '\n\n']

print(''.join(list1))


   


 浔阳江头夜送客，枫叶荻花秋瑟瑟。
   
 。主人下马客在船，举酒欲饮无管弦。

醉不成欢惨将别，别时茫茫江浸月





遍历列表后，用strip()去除换行符变成空字符

In [7]:
list1 = ['\n  \n \n', '\n', '\n 浔阳江头夜送客，枫叶荻花秋瑟瑟。','\n   \n 。主人下马客在船，举酒欲饮无管弦。\n\n', '醉不成欢惨将别，别时茫茫江浸月\n', '\n\n']

list2 = [i.strip() for i in list1]
print(list2)

['', '', '浔阳江头夜送客，枫叶荻花秋瑟瑟。', '。主人下马客在船，举酒欲饮无管弦。', '醉不成欢惨将别，别时茫茫江浸月', '']


遍历列表后去除空字符

In [None]:
list3 = [x for x in list2 if x != '']
print(list3)