使用python构建递归算法，实现查找电脑中的所有文件

趣谈数据分析 11-01 597

前言：

目前姐妹们对“递归算法的实现”可能比较着重，我们都想要分析一些“递归算法的实现”的相关知识。那么小编也在网上搜集了一些对于“递归算法的实现””的相关知识，希望各位老铁们能喜欢，看官们一起来学习一下吧！

最近在实际工作中遇到一个需求，需要检测一个大文件夹下所有文件的更新状态，这个大文件夹下面包含了很多文件和文件夹，文件夹中又包含了很多文件和文件夹...... 类似下面这张图片。

看到这么多层的包含嵌套关系，我们首先想到的可能是使用for循环，但是在这个需求中，for循环不能满足我们的要求，原因有两个：

1、我不能确定文件夹中到底嵌套了多少层2、使用for循环为增加代码量并且不好维护

由于这些痛点，我们选择使用递归算法来实现。递归算法，通俗的解释是后一步需要依据前一步的结果来进行，所以我们可以定义一个函数，在满足条件的是的在函数内部调用这个函数：我们先来看python代码：

file_list = []def get_file_url(session, next_url): next_response = session.get('' + next_url) soup = BeautifulSoup(next_response.text, 'html.parser') folders = soup.find_all('tr', class_=re.compile("^tree-item file_")) for folder in folders: folder_name = folder.find('td').find('a').attrs['title'] folder_url = folder.find('td').find('a').attrs['href']  if len(folder_name.split('.')) > 1: file_list.append(folder_url) else: get_file_url(session, folder_url)

逻辑其实很简单，我们首先判断一下，如果这个文件含有后缀，我们就判断它是个文件，否则就判断它是一个文件夹。当判断是文件夹的时候，就接着调用这个函数，直到文件中包含文件，不包含文件夹，本次递归停止。

很多人学了很多算法之后不知道怎么用，这就是一个很好的例子，只不过我是在网页上递归寻找文件，你也可以自己在本地试一试。

本文地址：http://www.longkongtuishu.com/ca25eBA1sAFUEAVU.html

标签： #递归算法的实现