Python 基础学习08:自定义函数

借助自定义函数可以将 Python 代码进行抽象,能够更高效的复用和更好的理解代码。

学习自定义函数之前,需要了解编程中的抽象。
抽象除了可以避免重复,更重要的点在于:抽象是程序能够被理解的关键。
计算机本身喜欢具体而明确的指令,但人通常是不行的。可以通过抽象的方式让一个程序变得容易理解,例如以下的伪代码:

page = download_page()
freqs = compute_frequencies(page)
for word, freq in freqs:
    print(word, freq)

通过阅读上述伪代码即可知程序的用途,但实际操作的具体细节是独立在定义的函数中的。

自定义函数

函数执行特定的操作并返回一个值(并不是所有的函数都会返回值),通过函数的名称可以进行调用(调用时可能需要提供一些参数,参数放在圆括号中)。
判断某个对象是否可以被调用,可以使用内置函数 callable

callable(print)
True
callable(list)
True
x = 1
callable(x)
False

使用 def 语句来定义自定义函数:

def hello(name):
    return ('Hi, ' + name + '!')

print(hello('imxcai'))
Hi, imxcai!

给自定义函数编写文档

给自定义函数写文档,通常在 def 语句后面添加独立的字符串,以便他人能够理解。

def square(x):
    'Calculates the square of the number x.'
    return x * x

help(square)
Help on function square in module __main__:

square(x)
    Calculates the square of the number x.

也可以通过自定义函数中的特殊属性 __doc__ 进行查看:

square.__doc__
'Calculates the square of the number x.'

不是函数的函数

Python 中的有些函数什么都不返回。什么都不返回的函数不包含 return 语句,或者 return 语句后面没有指定值。

def test():
    print('this  is printed')
    return
    print('this is not print')


test()
this  is printed

此处的 return 只是为了结束函数,

x = test()
this  is printed
x
type(x)
<class 'NoneType'>
print(x)
None

因为函数没有返回值,所以 x 的值为空。

参数

定义函数时,函数内部使用的参数从何而来?
编写函数旨在为当前程序提供服务,对应的职责是确保它在提供正确参数时完成任务,并在参数不对时提示错误。

修改参数

函数通过参数获得了一系列的值,但是在函数内部赋值对外部没有任何影响:

def test(x):
    x  = 1000

x = 10
test(x)
x
10

参数存储在局部作用域内。

字符串和元组是不可变的,意味着不能修改,只能替换为新值,如果参数是可变的,例如列表:

def change(x):
    x.append(1000)


x = [1,2,3]
change(x)
x
[1, 2, 3, 1000]

将同一个列表赋给两个变量时,这两个变量将同时指向这个列表。
要避免这样的结果,必须创建列表的副本:

a = [1,2,3]
change(a[:])
a
[1, 2, 3]

为什么要修改参数

使用函数来修改数据结构是能提供程序的抽象程度。抽象的关键在于隐藏所有的操作细节。
参考示例:

def init(data):
    'init a new dict to store name info.'
    data['first'] = {}
    data['middle'] = {}
    data['last'] = {}

def lookup(data, label, name):
    'lookup name info'
    return data[label].get(name)

def store(data, full_name):
    'store name in data dict'
    names = full_name.split()
    if len(names) == 2: names.insert(1, ' ')
    labels = 'first', 'middle', 'last'
    for label, name in zip(labels, names):
        #print(label)
        people = lookup(data, label, name)
        if people:
            people.append(full_name)
        else:
            data[label][name] = [full_name]

如果参数是不可变的

在 Python 中,没有办法直接在函数内部赋值来影响函数外部的变量。
这种情况下可以从函数返回所需要的值,如果是多个值使用元组的方式:

def foo(x):
    return x + 1

x = 10
x = foo(x)
x
11

如果一定要修改参数,另一种方式就是使用列表或字典结构:

data = {'name': 'imxcai', 'blog': 'imxcai.com'}
def change(d,  k, v):
    d[k] = v


change(data, 'blog', 'www.imxcai.com')
data
{'name': 'imxcai', 'blog': 'www.imxcai.com'}

关键字参数和默认值

前面使用的参数都是位置参数,位置参数最重要的就是位置:

def test_1(a, b):
    print('{}, {}!'.format(a, b))


def test_2(b, a):
    print('{}, {}!'.format(b, a))


test_1('hi', 'imxcai')
hi, imxcai!
test_2('hi', 'imxcai')
hi, imxcai!

但是参数很多时,参数排列的顺序就很难记忆,可指定参数的名称,这种参数称为关键字参数:

def test_3(greeting, name):
    print('{}, {}!'.format(greeting, name))


test_3(greeting='hi', name='imxcai')
hi, imxcai!
test_3(name='imxcai', greeting='hi')
hi, imxcai!

此时参数是根据名称来调用的,跟顺序没有关系,同时在创建函数时可以赋予默认值:

def test_4(greeting='hi', name='imxcai'):
    print('{}, {}!'.format(greeting, name))


test_4()
hi, imxcai!
test_4('Hello')
Hello, imxcai!
test_4(name='bob')
hi, bob!
test_4(greeting='hi', name='bob')
hi, bob!
test_4('hello', 'bob')
hello, bob!

指定默认参数后,调用函数可以一个参数也不传,也可以按照位置传递参数,当只传递 name 时,需要通过名称指定,非常灵活。

收集参数

允许用户提供任意数量的参数很有用,在 Python 中,在函数定义时,参数前面添加一个星号就可以实现:

def print_params(*params):
    print(params)


print_params(1)
(1,)
print_params(1,2,3)
(1, 2, 3)

参数前面的星号将提供的所有值(包括一个)都放在一个元组中。
星号可以收集余下位置的参数,如果没有可供收集的参数,将返回一个空元组:

def print_info(title, *params):
    print(title, params)


print_info('this is title', 1,2,3)
this is title (1, 2, 3)
print_info('title', 1)
title (1,)
print_info('title')
title ()

带星号的参数放在开头、中间、末尾都是一样的。

星号不会收集关键字参数:

print_info('title',1,2,3, z=4)
Traceback (most recent call last):
  File "<pyshell#110>", line 1, in <module>
    print_info('title',1,2,3, z=4)
TypeError: print_info() got an unexpected keyword argument 'z'

使用两个星号来收集关键字参数,得到是一个字典而不是元组:

def print_info2(title, *para, **key):
    print(title, para, key, sep='\n')


print_info2('This is titile', 1,2,3, z=4)
This is titile
(1, 2, 3)
{'z': 4}

使用收集参数为前面的程序做修改:

def init(data):
    'init a new dict to store name info.'
    data['first'] = {}
    data['middle'] = {}
    data['last'] = {}

def lookup(data, label, name):
    'lookup name info'
    return data[label].get(name)

def store(data, *full_names):
    'store name in data dict'
    for full_name in full_names:
        names = full_name.split()
        if len(names) == 2: names.insert(1, ' ')
        labels = 'first', 'middle', 'last'
        for label, name in zip(labels, names):
            #print(label)
            people = lookup(data, label, name)
            if people:
                people.append(full_name)
            else:
                data[label][name] = [full_name]


storage = {}
init(storage)
store(storage, 'Geg Tom', 'Hanna Withe')
print(storage)

这样可以一次性存储多个名字。

分配参数

在定义参数时使用一个或两个星号来收集参数,在调用参数时使用运算符星号来分配参数。

x = (1,2)
def foo(x, y):
    return x+y
foo(*x)
3

也可以将字典中的值分配给关键字参数:

def test_3(greeting, name):
    print('{}, {}!'.format(greeting, name))


test_3(**data)
hi, imxcai!

只有在定义函数(允许可变数量的参数)或调用函数时(拆分字典或序列)使用,星号才能发挥作用。

练习使用参数

参数有很多提供和接受方式,以下是一个综合示例:

def story(**kwds):
    return 'Once upon a time, there was a '\
           '{job} called {name}.'.format_map(kwds)

def power(x, y, *others):
    if others:
        print('Received redundant parameters:', others)
    return pow(x, y)

def interval(start, stop=None, step=1):
    'Imitates range() for step > 0'
    if stop is None:
        start, stop = 0, start
    result = []

    i = start
    while i < stop:
        result.append(i)
        i += step
    return result

使用上述函数:

print(story(job='writter', name='bob'))
Once upon a time, there was a writter called bob.

print(story(**params))
Once upon a time, there was a language called python.

del params['job']
print(story(job='stroke of genius', **params))
Once upon a time, there was a stroke of genius called python.

power(2,3)
8
power(2,3,4)
Received redundant parameters: (4,)
8
power(x=2, y=3)
8
params = (5,) * 2
params
(5,5)
power(*params)
3125
power(3,3, 'hello world')
Received redundant parameters: ('hello world',)
27

interval(10)
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
interval(1,5)
[1, 2, 3, 4]
interval(1,12,4)
[1, 5, 9]
power(*interval(3, 7))
Received redundant parameters: (5, 6)
81

作用域

内置函数 vars 返回一个字典,这个字典称为命名空间或作用域。

x = 1
scope = vars()
scope['x']
1

除全局作用域外,每个函数调用都将创建一个作用域。
在函数内部使用的变量称为局部变量,不影响全局变量,因此参数与全局变量同名不会有任何问题。

要在函数中读取全局变量,如果仅仅是读取不重新关联,通常不会引发问题:

def combine(para):
    return para + external

external='world'
print(combine('hello'))
helloworld

如果局部变量与全局变量同名,就无法直接访问全局变量,因为全局变量会被局部变量遮盖,如有需要,可以使用 globals 来访问全局变量:

def combine(para):
    external = 'word'
    return para + external

external = 'world'
print(combine('hello'))
helloword

def combine_global(para):
    return para + globals()['external']

print(combine_global('hello',))
helloworld

在函数内部给变量赋值时,该变量默认为 局部变量,可以通过 global 关键字告诉 Python 这是全局变量:

x = 1
def change_global():
    global x
    x  += 1


change_global()
x
2

作用域嵌套

Python 函数可以嵌套,可将一个函数放置到另一个函数中:

def foo():
    def bar():
        print('Hello world!')
    bar()

使用一个函数来创建另一个函数:

def multiplier(factor):
    def multiplyByFactor(number):
        return number * factor
    retrun multilyByFactor

外面的函数返回的是里面的函数,而不是调用内部的函数,重要的是,返回的函数能够访问其定义所在的作用域,每个返回的函数携带着自己所在的环境。

double = multiplier(2)
double(5)
10

triple = multiplier(3)
triple(5)
15

multiplyByFactor 这样存储其所在作用域的函数称为闭包

递归

函数可以调用其它函数,递归就是函数调用函数本身。
递归函数通常包含以下两部分:

  • 基线条件:满足这种条件时函数将直接返回一个值(结束条件)
  • 递归条件:包含一个或多个调用,这些调用旨在解决问题的一部分

关键是将问题分解为小问题,可避免递归没完没了,因为问题终将被分解为成基线条件可以解决的最小问题。

案例一:阶乘

计算数字 n 的阶乘为 n*(n-1)*(n-2)...*1,可用循环的方式解决:

def factorial(n):
    result = n
    for i in range(1, n):
        result *= i
    return result

print(factorial(10))
3628800

使用递归的方式,可以考虑基线条件和递归条件:

  • 基线条件: 1 的阶乘为 1
  • 递归条件:对于大于1的数字n,其阶乘为 n-1 的阶乘再乘以 n
def factorial(n):
    if n==1:
        return 1
    else:
        return n * factorial(n - 1)


factorial(10)
3628800

函数调用 factorial(n)factorial(n-1) 是不同的实体。
大多数情况下循环的效率可能较高,但使用递归的可读性更高。

案例二:二分查找

二分查找算法引出了递归定义和实现,分析递归两部分:

  • 基线条件:如果上限和下限相同,就表明都指向数字所在的位置,只需将数字返回即可
  • 递归条件:否则找出区间的中间位置,再确定数字是在左半部分还是右半部分,然后再从这半部分中查找

二分查找的实现:

def story(**kwds):
    return 'Once upon a time, there was a '\
           '{job} called {name}.'.format_map(kwds)

def power(x, y, *others):
    if others:
        print('Received redundant parameters:', others)
    return pow(x, y)

def interval(start, stop=None, step=1):
    'Imitates range() for step > 0'
    if stop is None:
        start, stop = 0, start
    result = []

    i = start
    while i < stop:
        result.append(i)
        i += step
    return result

测试:

seq = [34, 65,78,123,4,100,95]
seq.sort()
seq
[4, 34, 65, 78, 95, 100, 123]
search(seq, 95)
4
seq[4]
95

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理

滚动至顶部