【Linux】网络基础2---Socket编程预备
相关专栏【Linux专栏】【C语言专栏】【测试专栏】上期回顾【Linux 】网络基础1文章目录1. 理解源IP地址和目的IP地址2. 认识端口2.1端口号范围划分2.2 理解 端⼝号 和 进程ID2.3 源端口号与目的端口号2.4 理解Socket2. 传输层的典型代表2.1 TCP协议传输层协议2.2 UDP协议传输层协议UDP 的优缺点3. 网络字节序3.1 认识大小端按照字节为单位3.2 网络字节序采用“大端方式”存储3.3网络字节序与主机字节序之间的转换4. socket 编程接口4.1 socket 常见API4.2 sockaddr 结构1. 理解源IP地址和目的IP地址IP 在网络中⽤来标识主机的唯⼀性注意数据传输到主机是⽬的吗答案不是的数据传输到主机不是目的而是手段毕竟聊天是人在聊下载是人在下载浏览网页是人在浏览进程是人在系统中的代表即人在系统中就相当于进程只要把数据给进程人就相当于拿到了数据上网在技术的角度只有两种行为IO1.从远端服务器获取数据2.本地数据上传到远端服务器IO:输入/输出2. 认识端口端⼝号( port )是传输层协议的内容端口号可以用来标识系统中唯一的一个网络进程IP表示全国内唯一的主机port表示该主机内唯一的进程IP Port 全国唯一的进程端⼝号是⼀个 2 字节 16 位的整数范围是0 ~ 655351字节8个bit端⼝号⽤来标识⼀个进程, 告诉操作系统, 当前的这个数据要交给哪⼀个进程来处理;IP地址 端⼝号能够标识⽹络上的某⼀台主机的某⼀个进程;⼀个端⼝号只能被⼀个进程占⽤.2.1端口号范围划分0 - 1023 : 知名端⼝号, HTTP, FTP, SSH 等这些⼴为使⽤的应⽤层协议, 他们的端⼝号都是固定的比如120、110、119等电话他们的服务都是一 一对应的1024 - 65535 : 操作系统动态分配的端⼝号. 客⼾端程序的端⼝号, 就是由操作系统从这个范围分配的2.2 理解 “端⼝号” 和 “进程ID”1. 端口号和进程 IP 都能用来唯一标识一台主机上的某个进程但在网络通信中并不能用进程 ID 来替代端口号原因作用范围不同PID 只在你的电脑内部有效另一台电脑根本不知道你的 PID 是什么。而端口是网络通信的全球通用规则服务必须绑定一个众所周知的固定端口比如 Web 服务默认用 80 或 443其他设备才能找到它。生命周期不同PID 在进程重启后会改变。如果一个服务把 PID 作为网络入口那它每次重启客户端都要重新获取新的 PID这在现实中不可行比如我们都有身份证但是在不同的场景就不好管理比如我们在学校、工作中要是都用身份证当我们换了一个学校工作地方我们登记的信息是不是就都要改变了所以我们在学校就用学号代表我们的身份工作中就是用工号这样每次我们需要变更环境时我们都能有新的信息代表而不用更改原来的。而端口绑定的是服务类型程序重启只要还是这个服务就应继续使用同一个端口。一对多的矛盾一个进程可以监听多个端口就像一个人开多家店同时多个不同进程也可以绑定到同一个端口但同一时间只有一个能成功。反过来一个端口也只能被一个进程使用。PID 和端口之间是灵活的 多对多关系无法简单替代。2. 如何通过端口号 port 找到对应的进程在底层中采用哈希的方式建立了端口号和进程 PID 之间的映射关系。底层拿到一个端口号 - 执行hash算法得到与之对应的PID - 找到对应的进程2.3 源端口号与目的端口号传输层协议( TCP 和 UDP )的数据段中有两个端⼝号, 分别叫做源端⼝号和⽬的端⼝号:源端口号标识发送端发起通信的进程目的端口号标识接收端要交付的目标进程2.4 理解Socketipport 叫做套接字 socketIP 地址⽤来标识互联⽹中唯⼀的⼀台主机 port ⽤来标识该主机上唯⼀的⼀个⽹络进程IPPort 就能表⽰互联⽹中唯⼀的⼀个进程通信的时候本质是两个互联⽹进程代表⼈来进⾏通信{srcIpsrcPortdstIpdstPort}这样的4元组就能标识互联⽹中唯⼆的两个进程网络通信的本质也是进程间通信socket n. (电源)插座(电器上的)插⼝插孔管座槽窝托座⾅孔⽳ vt. 把…装⼊插座给…配插座2. 传输层的典型代表网络协议栈贯穿整个网络体系结构在应用层中操作系统层和驱动层各自占有一部分网络协议。传输层写在操作系统中当使用系统提供的接口实现网络通信时必须要面对的就是传输层的协议传输层最典型的协议是 TCP 和 UDP 。2.1 TCP协议传输层协议TCPTransmission Control Protocol传输控制协议是互联网核心的传输层协议主要解决一个问题如何在不可靠的网络上建立可靠的逻辑连接。它最关键的三个特性是有连接通信前必须通过“三次握手”建立连接。就像打电话得先拨号、对方接听、建立通路才能通话。可靠传输具备确认和重传机制。发送的每个数据包都要求对方回复“收到了”否则就重发。它能保证数据完整、有序、不重复地到达。流量与拥塞控制面向字节流发送方会根据接收方的处理能力和网络拥堵程度自动调整速度避免丢包。对比 UDPTCP 是可靠的、有连接的、速度较慢、有流量控制。而 UDP 不可靠、无连接、速度快像寄快递不管收没收到常用于视频通话、直播等允许偶尔卡顿的场景。2.2 UDP协议传输层协议UDPUser Datagram Protocol用户数据报协议是 TCP 的“简单快速”兄弟。它与 TCP 同属传输层但核心逻辑截然不同它不建立连接不保证可靠也不做流量控制主打一个“尽力而为”。核心特性1. 无连接发送数据前不需要像 TCP 那样“三次握手”。直接发不管对方在不在、收不收得到。就像写信投递不确认对方是否在家。2. 不可靠传输不保证送达数据可能丢失、重复、乱序。也没有确认和重传机制。对方收没收到UDP 协议本身完全不关心。3. 面向数据报这是 UDP 与 TCP“面向字节流”的最大区别。UDP 保留应用层发来的消息边界。应用程序每次 send 一个数据报对方 recv 就能原封不动地读到整个数据报前提是接收缓冲区够大。不会发生 TCP 那样的“粘包”问题。UDP 的优缺点优点速度快、开销极小。UDP 的头部只有 8 个字节 TCP 是 20 字节且没有连接建立、确认、拥塞控制等步骤。因此实时性极高。缺点不稳定、有大小限制。单个 UDP 数据报最大 64KB通常建议不超过 1.5KB 以免分片。超出后IP 层会自动分片一旦一个分片丢失整个数据报就废了。问题1有连接和无连接怎么理解连接就好比我们打电话的时候会先“喂”即确保连接了之后我们的沟通才是有效的无连接就好比我们发送邮件要么不发要么发当我选择发我不关心你收没收到我发了就行3. 网络字节序3.1 认识大小端按照字节为单位大端模式数据的高位字节处的内容存放在内存的低地址处而数据的低位字节处的内容存放在内存的高地址处。小端模式数据的高位字节处的内容存放在内存的高地址处而数据的低位字节处的内容存放在内存的低地址处。3.2 网络字节序采用“大端方式”存储发送主机通常将发送缓冲区中的数据按内存地址从低到⾼的顺序发出;接收主机把从⽹络上接到的字节依次保存在接收缓冲区中,也是按内存地址从低到⾼的顺序保存;因此,⽹络数据流的地址应这样规定:先发出的数据是低地址,后发出的数据是⾼地址TCP/IP协议规定,⽹络数据流应采⽤⼤端字节序,即低地址⾼字节.不管这台主机是⼤端机还是⼩端机, 都会按照这个TCP/IP规定的⽹络字节序来发送/接收数据;如果当前发送主机是⼩端, 就需要先将数据转成⼤端; 否则就忽略, 直接发送即可3.3网络字节序与主机字节序之间的转换h表⽰host,n表⽰network,l表⽰32位⻓整数,s表⽰16位短整数。例如 htonl 表⽰将 32 位的⻓整数从主机字节序转换为⽹络字节序,例如将IP地址转换后准备发送。如果主机是小端字节序,这些函数将参数做相应的⼤⼩端转换然后返回;如果主机是大端字节序,这些函数不做转换,将参数原封不动地返回。!!! 所有发送到网络上的数据都必须是大端的4. socket 编程接口4.1 socket 常见API1创建socket文件描述符TCP/UDP客户端服务器int socket (int domain,int type,int protocol);2绑定端TCP/UDP服务器int bind(int socket,const struct sockaddr *address, socklen_t address_len);3开始监听socketTCP服务器int listen(int socket, int backlog);4接收请求TCP服务器int accept(int socket, struct sockaddr* address, socklen_t* address_len);5建立连接TCP客户端int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);4.2 sockaddr 结构socket APIAPI-应用程序编程接口是⼀层抽象的⽹络编程接⼝,适⽤于各种底层⽹络协议,如IPv4、IPv6,以及后⾯要讲的UNIX Domain Socket. 然⽽, 各种⽹络协议的地址格式并不相同.IPv4和IPv6的地址格式定义在netinet/in.h中,IPv4地址⽤sockaddr_in结构体表⽰,包括16位地址类型,16位端⼝号32位IP地址.IPv4、IPv6地址类型分别定义为常数AF_INET、AF_INET6. 这样,只要取得某种sockaddr结构体的首地址,不需要知道具体是哪种类型的sockaddr结构体,就可以根据地址类型字段确定结构体中的内容.socket API可以都⽤struct sockaddr类型表⽰, 在使⽤的时候需要强制转化成sockaddr_in*; 这样的好处是程序的通⽤性, 可以接收IPv4, IPv6, 以及UNIX Domain Socket各种类型的sockaddr结构体指针做为参数sockaddr 结构struct sockaddr { __SOCKADDR_COMMON (sa_); /* Common data:address famliy and length. char sa_data[14]; /* Address data. */ };sockaddr_in 结构struct sockaddr_in { __SOCKADDR_COMMON (sin_); in_port_t sin_port; // 端口号 struct in_addr sin_addr; // IP 地址 /* Pad to size of struct sockaddr. */ unsigned char sin_zero[sizeof (struct sockaddr) - __SOCKADDR_COMMON_SIZE - sizeof (in_port_t) - sizeof (struct in_addr)]; };虽然socket api的接⼝是sockaddr, 但是我们真正在基于IPv4编程时, 使⽤的数据结构是sockaddr_in;这个结构⾥主要有三部分信息: 地址类型, 端⼝号, IP地址.in_addr结构typedef uint32_t in_addr_t; struct int_addr { in_addr_t s_addr; };in_addr⽤来表⽰⼀个IPv4的IP地址. 其实就是⼀个32位的整数;
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2632882.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!