Linux套接字编程

时间:2014-08-27 16:08:57   收藏:0   阅读:284

在网络中进程之间进行通信的时候,那么每个通信的进程必须知道它要和哪个计算机上的哪个进程通信.否则通信无从谈起!在本地可以通过进程PID来唯一标识一个进程,但是在网络中这是行不通的.其实TCP/IP协议族已经帮我们解决了这个问题,网络层的“ip地址”可以唯一标识网络中的主机,而传输层的“协议+端口”可以唯一标识主机中的应用程序(进程).这样利用三元组(ip地址,协议,端口)就可以标识网络的进程了,网络中的进程通信就可以利用这个标志与其它进程进行交互.

什么是套接字?

套接字是作为4BDS UNIX的进程通信机制,它用于描述 IP 地址和端口,是一个用于通信连接的文件描述符.举个例子来说.套接字就好像是银行的服务窗口.然后每个服务窗口上面都有一个标号(对应套接字的 IP 地址),然后银行又有规定标号为多少的窗口提供什么服务(窗口标号就类似套接字中记录的 IP 地址,服务就类似着套接字的端口号),那么客户就可以根据这个窗口标号去请求所需要的服务.

在 socket 中是怎么做到对另一个套接字连接的

首先很明显,上面一直在强调两个进程在进行与网络通信的时候,两个进程都必须知道对方是谁(通过"ip地址+端口"),否则就无法进行通信,可以设想下你写了封信给你的朋友小明,那么你忘了写寄信地址和寄信人.那么你把这份信寄了.然后你就开始等待小明的回信,那么小明就算收到信了也不知道这封信是谁寄的和该把回复信寄给谁.那么你能收到回信么?

但是有时候你在写通信时候比如 tcp 的客户端,你发现你没有对套接字进行地址绑定也依旧可以和服务器通信,那这又是为什么?因为操作系统帮你做了这件事,操作系统在发现你没有将一个套接字绑定到对应的 ip 地址和端口号而调用 listen 和connect 的时候.那么它会自动给你分配 IP 地址和端口号.接着上面那个寄信的例子,假设你在寄信的时候是托给个朋友帮你寄.那么这个好心的朋友发现了你犯的这个粗心的错误.那么他便把在寄信人和寄信地址处填写上了你的名字和你的地址,那么小明就可以和你正常通信了.

既然这为什么服务器还要大费周章的去对一个监听端口进行地址绑定呢?我们还是用上面那个寄信的例子来说,假设你很有钱,有三套房子(即服务器对应三个 IP),你依旧没有写寄信人和寄信地址.那么你虽然托朋友给你寄,但是你这个朋友也不确定你现在住那套房子里,那么他便把这个三个地址之中的一个地址填了上去.而恰恰很不幸的是你已近很久没有住那套房子了.那么小明即使回复了你的信,你也可能收不到信了.所以服务器必须要对监听套接字进行地址进行绑定!

什么是大小端

因为计算机内存是以字节(八位)为单位来存储东西的.那么在存储大于一字节的数据时候就会存在一个问题,按什么样的顺序去存放这样的数据,是低位字节排放在内存的低地址端还是低位字节排放在内存的高地址端.然而这个往往和具体CPU架构有关,而非操作系统.那么首先我们来说明下大端模式和小端模式的区别:

这样也许不好理解那么举个例子来说.如果将一个 16 位的整数 0x1234 存放到一个短整型变量(short)中,这个短整型变量采用大端或者小端模式在内存中的存储由下表所示.

 bubuko.com,布布扣

socket 中的 tcp 编程的大致流程

bubuko.com,布布扣

注意问题

  1. 大型数据的发送与接收.这里打大型数据指的是大于接收缓冲区或者发送缓冲区的数据.对于这种数据就需要多次调用 recv 或 send 等等的函数来发送或者接收.
  2. TCP 是基于流发送的.所以当间隔很短发送的数据,在服务器中可能因此一次性收到,对此要进行相关处理.
  3. 若 TCP 保持长连接的话,要进行检查连接是否存在.常见的方法是用心跳包来检查连接是否存在.
  4. 大小端问题.在网络传输数据的时候记得只要超过两字节的二进制数据就要用 htosXX 函数和 stohXX 函数来对数据进行处理,因为在终端平台的大小端问题.但是超过两字节的字符数据不需要注意终端平台大小端问题.在网络中 TCP/IP 各层协议将字节序(网络字节序)定义为Big-Endian
  5. 对于为绑定地址和端口的套接字系统会随机分配端口和绑定本机上的 IP 给套接字用.对于因特网域,如果指定IP地址为 INADDR_ANY,套接字端点可以被绑定到所有的系统网络接口.这意味着可以接受到这个系统锁安装的所有网卡的数据包,如果调用 connect 或 listen ,但没有绑定地址到一个套接字,系统会选一个地址并将其绑定到套接字.

地址结构体

IPv4:  为了使用不同格式地址能够被传入到套接字函数,地址被转换成通用的地址结构 sockaddr IPv4,在 IPv4 因特网域(AF_INET)中,套接字地址用如下结构 sockaddr_in 表示:
struct in_addr{in_addr_t s_addr;};
struct sockaddr_in{
    sa_family_t sin_family;
    in_port_t  sin_port;
    struct in_addr sin_addr;
};
IPv6:  在 IPv6 因特网域(AF_INET6)套接字地址用如下结构 sockaddr_in6 表示:
struct in6_addr{
    sa_family_t  sin6_family;
    in_port_t  sin6_port;
    uint32_t sin6_flowinfo;
    struct in6_addr sin6_addr;
    uint32_t  sin6_scope_id;
};

地址查询

通过调用 gethostent 获取主机信息,当 gethostent 返回时,得到一个指向 hostent 结构体指针,该结构体可能包含一个静态的数据缓存区,每次调用 gethostlent 将会覆盖这个缓存区.返回的地址采用网络字节序.相关函数:

    • gethostent
    • sethostent
    • endhostent

相关结构体:

struct hostent{
    char *h_name;
    char **h_aliases;
    char h_addrtype;
    char h_length;
    char **h_addr_list;
...
};

将协议名字和协议号采用以下函数映射

相关函数

    • getprotobyname
    • getprotobynumber
    • getprotoent
    • setprotoent
    • endprotoend

相关结构体 

struct protoent{
    char* p_name;
    char** p_aliases;
    int p_proto;
} 

服务查询

服务是由地址的端口号部分表示的.每个服务由唯一的熟知的端口号来提供,采用函数 getservbyname 可以将一个服务名字映射到一个端口号,函数getservbyport将一个端口号映射到一个服务器名,或者采用函数 getservent顺序扫描服务数据库.相关函数:

    • getservbyname
    • getservbyport
    • getservent
    • setservent
    • endservent
相关结构体:
struct servent{
    char *s_name;
    char **s_aliases;
    int s_port;
    cjar *s_proto;
};

套接字的常用 API

参考资料

评论(0
© 2014 mamicode.com 版权所有 京ICP备13008772号-2  联系我们:gaon5@hotmail.com
迷上了代码!