GitHub

前言

文件的上传是我们做项目中一个必不可少的环节，但是偶尔我们也会遇到一些比较吃内存的大文本，对于这种文本，我们可以采用先切割，才分块上传，最后再在服务端合并的过程。如下图所示:

具体的代码我已经放置到GitHub上，有需自取。

实现过程

分割文本

// 设置切割文件的大小(单位kb)
    const LIMIT = 40000;
// 设置后台的url
    var url = 'upload.php';
// 记录开始大小
    var start = 0;
// 记录游标
    var offset = 0;

    $(function(){
        var startUpload = function(file){
            while(file.size > start){
                var form = new FormData();
                form.append('fileData', file.slice(offset * LIMIT , (offset + 1) * LIMIT));
                // 配合后台逻辑判断是否完结
                form.append('isFinished' , file.size - start > LIMIT ? false : true);
                // 保存名字
                form.append('name' , file.name);
                // 这里可以用来记录文件已经成功上传的文件块，可以用来断点续传
                form.append('currBlock' , start);
                $.ajax({
                    url: url,
                    type: 'POST',
                    cache: false,
                    data: form,
                    processData: false,
                    contentType: false
                }).done(function(res) {
                    console.log(res);
                }).fail(function(res) {
                    console.log(res);
                });
                start += LIMIT;
                offset ++ ;
            }
        }
        $('#upload').change(function(){
            var file = $(this).prop('files')[0];
            startUpload(file);
        });
    });

分割过程比较简单，其中主要的一个方法是用到了slice，该方法提供两个参数，分别是游标位置和要切割的长度，这个方法会把文件切割成我们规定大小的一个Blob文件块，这个对象存储的是文件的原始二进制数据，切割100个字节的结果console.log(file.slice(0 , 100)):

而FormData是H5提供的一个Api，可以让JS自主上传，这里我们添加了一个currBlock数据，虽然在我们的Demo中没有使用到，但是在真正的开发环境中，我们一般会提供一个断点续传功能，因此这个就派上了用场。

合并文本合并文本的工作就非常简单：

file_put_contents($fileName , file_get_contents($file['tmp_name']) , FILE_APPEND);

把传入的Blob直接追加到之前的文件里面即可，因为这里用FILE_APPEND会把指针直接移到文件最后，所以所占内存也比较小。

其他大文本操作

切割

其实对于大文本的切割我们也可以直接使用Linux的split来操作:

按大小划分

split -b 10m file file_part_

-b 10m代表把文件按照10m的大小来划分区域，file_part_是我们划分的文件的前缀名字

按行划分

split -l 100 file file_part_

-l 100代表以100行为一个节点来划分文件

其他

split -a 4 -n 4 file file_part_

-a 4用来设置生成的名字的长度

合并

与split相对的，Linux也有一个cat指令来合并小文件:

cat file_part_* > file_part_test

读取

在开发中，如果遇到大文本的读取，一次性的全部读取不太现实，所以我们需要逐行或者逐块读取，PHP给我们提供了两个很好用的函数，分别是fgets，fseek: fgets接受两个参数，第一个是文件句柄(handler)，第二个是我们需要读取的长度，默认是1024字节，当然遇到换行就会停止。

$handler = @fopen($file , 'r');
if($handler){
    while($buffer = fgets($handler , 2048) !== false){
// do something
    }
}
fclose($handler);

而fseek是用来操作文本指针的一个方法，该方法接受三个参数，第一个是文件句柄(handler)，第二个参数是偏移量，如果成功返回0，失败返回-1:

$handler = @fopen('./tmp/3.png' , 'r');
echo ftell($handler) . PHP_EOL;

// 设置到开头位置
fseek($handler , 0);

echo ftell($handler) . PHP_EOL;

// 设置到末尾位置
fseek($handler , 0 , SEEK_END);

echo ftell($handler) . PHP_EOL;

// 从当前指针往后移100位
fseek($handler , 100 , SEEK_CUR);

echo ftell($handler) . PHP_EOL;

// 设置到离开头100的位置
fseek($handler , 100 , SEEK_SET);

echo ftell($handler) . PHP_EOL;

输出:

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
README.md		README.md
index.html		index.html
test.php		test.php
upload.php		upload.php

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

前言

实现过程

其他大文本操作

切割

合并

读取

参考

About

Releases

Packages

Languages

nineyang/upload

Folders and files

Latest commit

History

Repository files navigation

前言

实现过程

其他大文本操作

切割

合并

读取

参考

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages