[oeasy]python0020换行字符_feed_line_lf_反斜杠n_B语言_安徒生童话

news2025/7/27 18:43:21

换行字符

 

回忆上次内容

  • struct包可以让我们使用封包格式
  • 把数字封包到字节里
  • pack函数负责封包
  • unpack函数负责解封
  • 我们通过封到不同的字节状态
  • 遍历了一次ascii码

 

  • 还是有那片黑色的区域
  • 好像是一片黑暗森林!
  • 那里面到底有些什么秘密?🤔
  • 我们这次向黑暗森林区域进发!!👊
  • 整理行装
  • 出发!

chr

  • 先看看"oeasy"这个字符串是如何存在的🤔

  • 字符都对应着一个数字
  • 数字在计算机上究竟是如何存储的呢?
  • 用二进制形式存储在字节中的
  • 可以看看这个二进制形式么?

chr

  • 8bit 构成 byte

  • 上图的字节为
  • (0011 0101)2
  • (35)16
  • 对应着字符'5'

  • 那字母呢?🤔
  • abcd在内存里长什么样子?

文件编码

  • 编写一个文件
  • 写下 abcd
  • 用 ​​:%!xxd​
  • ​:%!xxd -r​​ 变回来

  • 可以看到文件是用 2进制 方式存储的
  • 0x61 - a
  • 0x62 - b
  • 0x63 - c
  • 0x64 - d
  • 不论是内存、硬盘还是网络传输
  • a 对应
  • (0x61)16
  • (0b01100001)2
  • 图中最后的那个 0x0a 对应什么字符???

善用函数

  • 使用chr得到相关字符

  • 0x0a对应的是'\n'这个字符
  • 这个字符好像在哪里见过?🤔

回到最初

  • 想要了解这个'\n'
  • 我们还得回到最初
  • 我们回到开始的时候

  • 前面介绍过
  • BWK写的 c 语言的第一个程序

\n

  • 注意到​​hello world​​后面的​​\n​​了么?
  • 注意到​​hello world​​后面的​​\n​​了么?
  • 特别注意斜杠的方向
  • 这个方向​​\​​叫反斜杠
  • 键盘位置在回车键附近

  • 那​​\n​​到底是什么??🤔

输出"\n"

  • ​\n​​ 是一个整体
  • 占一个字节
  • 算一个字符
  • 序号是(​​10​​)​​10进制​
  • 也就是(​​0x0a​​)​​16进制​
  • 这就是在开篇时的​​abcd​​后面的字符
  • \n在内存里显示为一个.

  • 我们直接把他输出看看

输出

  • 输出
#输出\n
print("\n")
#直接print
print()
#查看序号
ord("\n")
#查看十六进制的序号
hex(ord("\n"))
  • 输出结果

  • 好像换了 2
  • 如果没​​\n​​的话,只换 ​​1​​ 行
  • 如果有​​\n​​的话, 就换 ​​2​​ 行
  • 我们看看ascii码表是如何定义的这第10个字符的

找到位置

  • 我们已经身在在黑暗森林中
  • 找到了一个落脚点

  • 十进制的​​10​​ 就是 十六进制的 ​​0x0A​
  • 这个数值在 ​​ascii​​ 码表中意思是 ​​LF​
  • 啥意思?

搜索

  • 搜索​​\n​​得到的结果是这样的
  • LF 意味着 Line Feed
  • 喂行
  • 喂一行纸

  • 那我真的可以用这个​​\n​​在字符中间换行嘛?

尝试换行

#输出字符串中带有\n
print("Hello\nWorld")
  • 在游乐场中尝试

  • 中途换行成功!
  • 可以多来几个换行符吗?

多来几个

  • 就往里面加​​\n​
#输出字符串中带有\n
print("He\nllo\nWor\nld")
  • 显然这个 ​​\n​​ 就是一个换行
  • 字符串里面有个 ​​\n​​ 就意味着需要换 1 行
  • 他的英文是 ​​Line Feed​
  • 意思就是 ​​新换1行​
  • 这个东西其实比 ascii 的历史还要悠久
  • 从打字机的时代就有了

  • 为什么要有换行符呢?

换行符

  • 最最开始的时候分段落
  • 都是靠打字机输出空格完成换行
  • 自从有了这个​​L​​ine​​F​​eed
  • 一个键就直接换行了
  • 所以​​L​​ine​​F​​eed 极大地提高了效率

  • 两个换行符就换两行
  • 可以使用chr函数么?

使用序号得到换行符

#输出ascii值为10的字符
chr(10)
#把这个字符放在print里面输出
print("hello"+chr(10)+"world")

  • 纯文本中也会有回车符么?
  • 我们去看看纯文本文件

打开文本文档

https://github.com/overmind1980/oeasy-python-tutorial.git
vi oeasy-python-tutorial/samples/000016/anderson_fairy_tales.txt
  • 首先下载这个仓库
  • 然后找到其中的安德森仙话这个本书

  • 我们发现这个东西是318K
  • 那他有多少字符呢?

字符数量

  • 1个英文字符占一个字节
  • 318k大概有318000个字节
  • 大概是31.8万个字符

  • 这就是文本文件的形式
  • 第一行的Andersen后面有应该有两个换行符
  • 是不是呢真有换行符呢?

字节形式

  • 所有行转化为字节形式
  • %!xxd
  • 查找0a
  • /0a

  • 确实能够找到那两个换行符(0a)
  • 这可以和纯文本方式对应起来吗?

纯文本方式

  • 文本中的换行
  • 其实就是换行符的效果
  • 在文本观看模式下是换行

  • 在字节观看模式下是0a

  • 这本书后来被翻译成安徒生童话

安徒生童话

  • 里面有很多耳熟能详的故事
  • 《皇帝的新装》
  • 《海的女儿》
  • 《丑小鸭》
  • 《红舞鞋》
  • 《卖火柴的小女孩》
  • 《拇指姑娘》

  • 在安徒生所处的时代(1805-1875)
  • 丹麦仍是一个君主专制主义社会
  • 20年代经济衰退
  • 童话用儿童视角透视复杂生活
  • 万物有灵
  • 风趣幽默
  • Jean Hersholt
  • 将160个故事从丹麦文翻译成英文
  • 刘半农 1914年
  • 翻译了《皇帝的新衣》开始
  • 叶君健 1944年到1949年
  • 翻译了 安徒生童话全集
  • 互联网时代
  • 英文版安徒生童话被谷腾堡项目所收录

落实

  • 文档当中就是用0和1来表示字符的
  • 如下图所示
  • 文字是蓝色的
  • 字节是黑色的

  • 为什么\n会用来表示换行(Line-Feed)呢?

追溯历史

  • ​c语言​​ 中的 ​​\n​​ 来自于什么呢?
  • 来自于 ​​B语言​
  • ​B语言​​ 是里奇和汤普逊最早开发 ​​unix​​ 的语言
  • ​B语言​​ 1969 年 就 运行在​​bell实验室​​ 的 ​​PDP-8​​ 上
  • 1971 年里奇和汤普逊开始对于 ​​B语言​​ 进行改造
  • 在新买的 ​​PDP-11​​ 上用 ​​B语言​​ 给 ​​B语言​​ 写扩展,称之为 ​​NewB​
  • 1973 年 ​​NewB​​ 基本主体完成
  • 改名叫 ​​c语言​
  • 所以 ​​c​​ 其实是 ​​NewB​
  • 他们用手头的编译器和​​c语言​​给 ​​PDP-11​​ 重写了一个 ​​Unix Kernel​
  • 机器语言和汇编语言本来不具有移植性
  • 就像x86的二进制程序不能直接运行在arm上
  • 需要移植
  • ​c语言​​ 程序却可以在 ​​很多架构​​ 的处理器上编译运行
  • 只要那种架构的处理器具有对应的 ​​c语言编译器和库​
  • 那就能顺利编译成针对该处理器架构的二进制程序
  • 甚至能实现跨平台编译
  • 也就是今天所说的交叉编译
  • 这就是 ​​c语言​​ 在当时能够发展的原因

  • ​c语言​​ 源自 ​​B语言​
  • ​B语言​​ 也不是凭空创造的
  • 源自什么呢?

Basic Combined Programming Language(BCPL)

  • ​B语言​​ 源自​​BCPL(Basic Combined Programming Language)​
  • 1967 年由剑桥大学的 ​​Matin Richards​​ 制作

  • 在同样由剑桥大学开发的 ​​CPL语言​​ 上改进而来
  • ​BCPL​​ 最早被用做牛津大学的 ​​OS6操作系统​​ 上面的开发工具

  • 后来通过美国贝尔实验室的改进和推广成为了 ​​UNIX​​ 上的常用开发语言
  • 最早 ​​BCPL​​ 语言的样子就有个类似于l(ine)f(eed)的符号
  • 这是关于换行符表示法 最早的记录
  • 当时的换行符长什么样呢?

BCPL的换行符

  • 当时的换行符长成这样
  • !\*n

  • 上述程序的目是
  • 输出 hello,world
  • 然后再来个回车
  • 所以hello world
  • 并不是c语言的发明
  • 而是从c语言的爷爷bcpl那时候就有了
  • 并且从bcpl时代就已经作为迷因(meme)开始传播
  • python虚拟机的可执行文件
  • 也就是pyc文件是如何理解换行符的呢?

反汇编(disassemble)

  • 观察一下

  • \n出现在字符串常量中
  • 能在pyc中找到这个常量么?

先编译

  • 将py文件编译成pyc文件

  • 再观察

pyc文件

  • 打开pyc文件

  • 确实能够找到a和s之间的\n
  • 也就是(0a)16进制
  • 任务完成!!!

总结

  • ​\n​​ 就是换行符号
  • 换行符对应着 ​​ascii​​ 字符的代码是(​​10​​)​​10进制​
  • 换行符的英文是 LF
  • 意思是​​Line Feed​
  • 我们可以在《安徒生童话》的文本中
  • 找到每个字符对应的字节形态

  • 不光txt文件是文件
  • 我们的python游乐场本质上也是一个二进制可执行的文件
  • 这个文件在哪?
  • 我们可以读懂这个可执行文件吗?🤔
  • 我们下次再说!👋
  • 蓝桥->​​https://www.lanqiao.cn/teacher/3584​​
  • github->​​https://github.com/overmind1980/oeasy-python-tutorial​​
  • gitee->​​https://gitee.com/overmind1980/oeasypython​​
  • 视频->​​https://www.bilibili.com/video/BV1CU4y1Z7gQ​​ 作者:oeasy

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/35266.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2022大厂面试秘籍Java岗:中间件+算法+HTTP+线程+虚拟机+分布式

前言 很多朋友对面试不够了解,不知道如何准备,对面试环节的设置以及目的不够了解,因此成功率不高。通常情况下校招生面试的成功率低于1%,而社招的面试成功率也低于5%,所以对于候选人一定要知道设立面试的初衷以及每个…

CSS 选择器

目录 1、导语 2、css基本选择器 1)、标签选择器 2)类选择器 3)ID选择器 4)通配符选择器 3、css组合选择器 1)标记类别选择器(交集选择器) 2)后代选择器 3)子选择器 4…

[足式机器人]Part3机构运动微分几何学分析与综合Ch02-2 平面机构离散运动鞍点综合——【读书笔记】

本文仅供学习使用 本文参考: 《机构运动微分几何学分析与综合》-王德伦、汪伟 《微分几何》吴大任 Ch02-2 平面机构离散运动鞍点综合2.3 鞍点圆2.3.1 鞍圆与二副连架杆R-R2.3.2 鞍圆误差2.3.3 四位置鞍圆2.3.4 五位置鞍圆2.3.5 多位置鞍圆2.3 鞍点圆 平面连杆机构中…

浅谈JVM(面试常考题)

文章目录JVM简介JVM 执行流程JVM运行时数据区(内存布局)程序计数器(线程私有)Java虚拟机栈(线程私有)堆(线程共享)方法区(线程共享)小结JVM类加载类加载的具体过程LoadingLinkingVerificationPreparationResolutionInitialization类加载的执行顺序双亲委派模型JVM中的垃圾回收机…

最新手工整理31省市自治区180+指标面板数据-各省份邮电和运输指标汇总(2002-2020)

1、数据来源:国家统计局 2、时间跨度:2002-2020 3、时间频率:年度 4、区域范围:31个省市⾃治区 5、邮电指标: 包裹数(万件)报刊期发数(万份)汇票业务(万笔)集邮业务量(万枚)固定本地电话通话时长(万分钟)固定长途…

流媒体技术基础-流媒体编码与协议

一、流媒体传输协议 1.实时传输协议RTP 针对多媒体数据流的一种传输协议,建立在UDP协议上,属于传输层协议。 定义互联网上传递音频和视频的标准数据包格式。RTP协议常用于流媒体系统(配合RTCP协议)、视频会议和视频电话系统&…

2022 APMCM亚太数学建模竞赛 C题 全球是否变暖 问题二python代码实现(更新完毕)

更新信息 2022-11-24 10:00 更新问题1和问题2 思路 2022-11-24 23:20 更新问题一代码 2022-11-25 11:00 更新问题二代码 相关链接 【2022 APMCM亚太数学建模竞赛 C题 全球是否变暖 问题一python代码实现】 【2022 APMCM亚太数学建模竞赛 C题 全球是否变暖 问题二python代…

爱尔兰博士后招聘|利默里克大学-广告学

[国外博士后招聘-知识人网]爱尔兰利默里克大学广告学博士后 爱尔兰利默里克大学是爱尔兰独立后第一所由政府资助而建的综合型独立大学。爱尔兰利默里克大学是爱尔兰七所国立大学之一,1972年开始招生,1989年被政府准予授予学位。利莫瑞克大学下设六个学院…

【学习笔记25】JavaScript字符串的基本认识

JavaScript字符串的基本认识一、严格模式二、字符串1、字面量2、构造函数3、包装类型三、字符集(了解)1、ASCII:128个2、GBK国标码:前128位ASCII,从129开始为汉字3、unicode(万国码)四、字符串的length与下标一、严格模…

【数论】质数

文章目录一、试除法判定质数二、试除法分解质因数三、筛法求素数1. 朴素筛法2. 埃氏筛法3. 线性筛法质数:大于1,且只包含1和本身两个因数的整数 一、试除法判定质数 如果是合数,那么因数一定是成对出现的,比如12,有2…

【Axure教程】能增删改数据的动态饼图

可视化视图是系统分析中非常重要的一个环节,今天作者就教大家在Axure中如何用中继器表格结合echarts图片,制作出一个能够动态增删改数据饼图的原型模板。需要制作的效果如下图所示: 自动生成饼图:通过修改中继器表格中的数据&…

教程三 在Go中使用Energy创建跨平台应用 - 状态控制

本文介绍在Energy中如何像浏览器一样控制状态, 页面的加载、前进、后退、刷新、暂停刷新 前提-需要安装好开发环境参考:教程一环境安装 创建应用 开发环境中 MacOSX平台必须在"GlobalCEFInit"之前设置CEF设置使用CEF 和 CEF框架目录,生成开发执行应用程…

【kafka】十、kafka消费者offset维护

消费者offset维护 offset维护 由于consumer在消费过程中可能会出现断电宕机等故障,consumer恢复后,需要从故障前的位置继续消费,所以consumer需要实时记录自己消费到了哪个offset,以便恢复后继续消费。 消费者是按照消费者组来保…

第八章 动态规划 3 AcWing 1554. 找更多硬币

第八章 动态规划 3 AcWing 1554. 找更多硬币 原题链接 AcWing 1554. 找更多硬币 算法标签 DP 背包问题 思路 经典01背包问题 闫氏DP分析法 状态表示 状态初始化 状态计算 状态转移方程式 要求字典序最小,因此先存硬币面额到数组再降序排列,保…

App逆向之frida-dexdump脱壳分析某肿瘤sign

声明:本文仅限学习交流使用,禁止用于非法用途、商业活动等。否则后果自负。如有侵权,请告知删除,谢谢!本教程也没有专门针对某个网站而编写,单纯的技术研究 一、firda 的安装 国内下载很慢:pip…

docker容器网络

第七章容器网络 Docker网络 veth pair:成对出现的一种虚拟网络设备,数据从一端进,从另一端出。用于解决网络命名空间之间隔离。 docker0:网桥是一个二层网络设备,通过网桥可以将Linux支持的不同端口连接起来&…

Git常见命令与使用,从0到1学会使用Git

👨‍💻个人主页: 才疏学浅的木子 🙇‍♂️ 本人也在学习阶段如若发现问题,请告知非常感谢 🙇‍♂️ 📒 本文来自专栏: 常见软件安装与运用 ❤️ 支持我:👍点赞…

linux NPS 服务端安装 +linux 客户端安装

本文参考博客: https://blog.csdn.net/m0_57776598/article/details/123674866 一、下载安装包 1、官方下载 官方下载地址:https://github.com/ehang-io/nps/releases 注意不要下错了,当前我下的版本为 v0.26.10 2、网盘下载 网盘下载&…

Python编程 字典的常用操作

作者简介:一名在校计算机学生、每天分享Python的学习经验、和学习笔记。 座右铭:低头赶路,敬事如仪 个人主页:网络豆的主页​​​​​​ 目录 前言 一.字典 1.访问字典(掌握) 2.字典的增加与修改(掌握) 3.系列删除(掌握) …

Web3中文|元宇宙在商业中的最佳应用

来源 | techrepublic 编译 | DaliiNFTnews.com 麻省理工学院斯隆管理学院的信息技术高级讲师Paul McDonagh-Smith说,麻省理工学院的人工智能先驱Marvin Minsky创造了“手提箱式词语”一词——即一些词或术语本身没有任何意义,而需要人去挖掘、赋予和丰…