今天发现了python中一个比较有意思的小设计。
如果要通过中括号[]访问元素,需要重写__get__item()函数,这个应该没什么疑问,测试代码如下:
class Classroom:
    def __init__(self, students):
        self.students = students
    def __getitem__(self, sid):
        for s in self.students:
            if s.sid == sid:
                return s
    def __len__(self):
        return len(self.students)
class Student:
    def __init__(self, sid, name):
        self.sid = sid
        self.name = name
    def __repr__(self):
        return str.format("sid: {}, name: {}", self.sid, self.name)
if __name__ == '__main__':
    class_room = Classroom([Student(12, "小明"), Student(13, "小华")])
    print(class_room[12]) 
通过中括号加学号的方式,可以获得对应学号的学生,代码顺利执行,没问题。

在我想要用for...in迭代时
if __name__ == '__main__':
    class_room = Classroom([Student(12, "小明"), Student(13, "小华")])
    for student in class_room:
        print(student) 
出现了问题,进入了死循环,控制台打印出迭代到的值一直是None

当我换一种写法时,就可以遍历成功了

但这么做有个问题,sid就不是学号了,而是students数组的下标,这和业务的语义是不相符的。但是我们先不忽略这一点,研究下for in到底是怎么实现的。
以Java为例,需要通过迭代器来迭代集合元素,集合元素通过next()方法获取元素,通过hasNext()方法探测迭代的终点。
那么python是如何只通过一个函数就能实现迭代的呢?
先说结论:从下标0开始迭代,直到__getitem__函数抛出IndexError异常。
for in刚开始迭代时,固定给getitem函数传了0,随后从0开始递增。


如果判断正确,students[sid],在迭代三次后,应该会抛出数组越界的异常IndexError,所以我怀疑可能是解释器把捕捉到IndexError异常作为了迭代终止的条件。(经过测试,只有IndexError会正常退出循环,其他类型的异常会直接显示报错)
修改代码,在第10次循环时,抛出异常

果然循环停止了,控制台打印结果:

再补充一点,通过iter函数以及next函数来迭代时,最终也是调用了getitem方法,下标也是从0开始。
if __name__ == '__main__':
    class_room = Classroom([Student(12, "小明"), Student(13, "小华")])
    # for student in class_room:
    #     print(student)
    stu_iter = iter(class_room)
    print(next(stu_iter))
    print(next(stu_iter))
    print(next(stu_iter)) 

如有错误,欢迎指正。

















