## Linux应用
• 如何快速找出当前目录下最晚被修改过的文件？
> ll -Ft | grep -v "/$"

• 已知某个进程的pid是6666,如何找到它当前打开了哪些文件？
> lsof -p 6666

• 发现端口8001被占用，如何找出是哪个进程占用了该端口？
> lsof -i:8001

> netstat -tulpn | grep :8001

• 假设有进程P持续向文件F写入数据，此时把文件F删除，进程P的写入会失败吗？磁盘占用是否会持续增加？为什么？
> 进程P不会写入失败，磁盘占用也会继续增加。因为实际上文件因被其他进程占用而并未删除，空间也未释放，当所有占用文件的进程都结束或重启时，空间才被释放。

• 给你一个文件，每行一个ip，如何用shell快速找到出现次数最多的ip？
> awk '{print $0}' ip.txt | sort | uniq -c | sort -nr | awk 'NR==1{print $2}'

• 有如下分行的数据：
|      32742 |
|      39013 |
|     481472 |
|     481658 |
|     481885 |
把格式转换为：32742,39013,481337,481472,481658,481885

```
awk -F ' '  '{if (NR==1) printf("%d", $2); else printf(",%d", $2)}' test.txt
```



## Python
• 为runner.py实现一个函数，检测是否有其他的runner.py进程在正在执行

In [None]:
import os
import sys
import subprocess
import psutil
import time

# method 1
def is_running1(service_name):
    command = "ps -ef | grep -v -e grep -e %s | grep %s" % (os.getpid(), service_name)
    completed_process = subprocess.run(command, capture_output=True, shell=True)
    if completed_process.returncode == 0 and service_name in str(completed_process.stdout):
         print('%s is running' % service_name)
         return True
    else:
         print('No other %s is running or call subprocess run error' % service_name)
         return False
    
# method 2, need psutil package
def is_running2(service_name):
    for q in psutil.process_iter():
        for cmd in q.cmdline():
            if service_name in cmd and q.pid != os.getpid():
                print('%s is running, pid: %s' % (service_name, q.pid))
                return True
    print('No other %s running' % service_name)
    return False

base_name = os.path.basename(sys.argv[0])
is_running1(base_name)
is_running2(base_name)

while 1:
    time.sleep(1)

• 如果有如下文件，记录了用户购买会员权益的订单记录

In [86]:
import datetime


def cal(selected_day):
    print(selected_day)
    result = 0
    with open('untitled.txt', 'r') as f:
        for line in f.readlines():
            import datetime
            user_id, cost, start_day, end_day = line.strip().split(',')
            start_date = datetime.datetime.strptime(start_day, '%Y%m%d')
            end_date = datetime.datetime.strptime(end_day, '%Y%m%d')
            
            int_vip_days = (end_date - start_date).days + 1
            print('days', int_vip_days)
            if start_day <= selected_day < end_day:
                result += int(cost) // int_vip_days
            elif selected_day == end_day:  # 不能整除
                result += int(cost) // int_vip_days + int(cost) % int_vip_days
    print('result', result)
    return result

cal('20200101')
cal('20200102')
cal('20200103')
cal('20200201')
cal('20200229')

20200101
days 30
days 30
days 30
days 60
result 2000
20200102
days 30
days 30
days 30
days 60
result 3000
20200103
days 30
days 30
days 30
days 60
result 3000
20200201
days 30
days 30
days 30
days 60
result 1333
20200229
days 30
days 30
days 30
days 60
result 1343


1343

## Golang
并行访问多个URl如"https://www.zhihu.com/robots.txt", "https://www.douban.com/robots.txt", 页面结果存入map，并且控制当访问所有页面总时间超过5s时程序结束请求


抱歉不会GO语言，我可以简单说一下python的思路。
并行意味着必须利用多核，就python而言，由于GIL的存在，只能使用多进程来处理并行操作。
可以使用multiprocessing库，或使用concurrent.futures中的ProcessPoolExecutor进程池完成任务。