# 日期和时间


R用一种特殊的类表示日期和时间，如同之前的列表类

-  日期用Date类表示，不包含时间，内部以1970-01-01至今的天数存储，可以使用 as.Date()函数强制转化字符串为Date 类
- 时间则由两个不同的类，POSIXct和POSIXIt来表示，内部时间则是以1970-01-01至今 的秒数来存储的

In [2]:
x <- as.Date("1970-01-01")
x ## [1]"1970-01-01"
unclass(x) #    如果是1970-01-01之前的日期是负数
## [1]0
unclass(as.Date("1970-02-01")) ## [1]31


许多绘图函数能识别日期时间对象，会给x轴一个特殊的格式

## 时间函数

可以 在POSIXct 和POSIXIt 之间来回类型转换，使用`as.POSIXct()` 或`as.POSIXlt()`函数


In [3]:
x <- Sys.time()
x # 已经是POSIXct格式 #[1]"2017-11-2616:01:13           CST"
unclass(x)


[1] "2024-08-22 00:48:11 EDT"

In [8]:
p <- as.POSIXlt(x)
p
as.data.frame(unclass(p)) #         见?DateTimeClasses


[1] "2024-08-22 00:48:11 EDT"

sec,min,hour,mday,mon,year,wday,yday,isdst,zone,gmtoff
<dbl>,<int>,<int>,<int>,<int>,<int>,<int>,<int>,<int>,<chr>,<int>
11.32631,48,0,22,7,124,4,234,1,EDT,-14400


In [7]:
p$sec
## [1]13.40519
weekdays(p)
## [1]"星期日"
months(p)
## [1]"十一月"
quarters(p)
## [1]"Q4"


## 时间函数


`strptime()`函数用于将任意格式的字符串表示的日期转换成时间对象POSIXIt,用到了所 谓的格式字符串

In [10]:
date <- c("0110,201210:40", "1209,201109:10")
x <- strptime(date, "%m %d,%Y %H:%M")
x


[1] "2012-01-10 10:40:00 EST" "2011-12-09 09:10:00 EST"

In [11]:
class(x)
## [1]"POSIXlt""POSIXt"


## 日期和时间运算


使用数学运算符(+,-,)和比较运算符(==,<=等)计算日期和时间，必须是相同的时间类之间 才能运算

In [15]:
x <- as.Date("2012-01-01")
y <- strptime("9 01 2011 11:34:21", "%d %m %Y %H:%M:%S")
x - y


“Incompatible methods ("-.Date", "-.POSIXt") for "-"”


ERROR: Error in x - y: non-numeric argument to binary operator


In [19]:
x <- as.POSIXlt(x)
c <- x - y
## Time difference of356.8511 days
c
class(c)


Time difference of 356.3095 days

日期时间运算符的好处在于能记录闰年，时令，时区

In [20]:
x <- as.Date("2012-03-01")
y <- as.Date("2012-02-28")
x - y


Time difference of 2 days

In [23]:
x <- as.POSIXlt("2012-10-25 01:00:00")
y <- as.POSIXlt("2012-10-25 01:00:00", tz = "GMT")
y - x


Time difference of -4 hours

## 计算时间差


时间间隔有若干种计算的方式，计算时又常常需要考虑闰年和时区的影响，默认得到的结 果是天数，也可以简单的换算成相应的时，分，秒，周.而如果要换算成月和年，需要用到序  列或者外部包里的函数

base包中常见的计算时间差的方式有： 
- time1-time2
- difftime(time1,time2,units)
- seq(time2,time1,by)    得到序列，通过length()   查看间隔

In [24]:
timel <- as.POSIXlt("2017-11-0411:59:00")
time2 <- as.POSIXlt("2015-11-0412:00:00")
timel - time2


Time difference of 730.9576 days

In [25]:
difftime(timel, time2, units = "weeks")


Time difference of 104.4225 weeks

In [26]:
td <- seq(time2, timel, by = "year")
td


[1] "2015-11-04 12:00:00 EST" "2016-11-04 12:00:00 EDT"

In [27]:
length(td)


In [28]:
seq(as.POSIXlt("2015-11-0412:00:00"), by = "month", length.out = 4)


[1] "2015-11-04 12:00:00 EST" "2015-12-04 12:00:00 EST"
[3] "2016-01-04 12:00:00 EST" "2016-02-04 12:00:00 EST"

In [34]:
seq(as.POSIXlt("2015-11-0412:00:00"), by = "-1 month", length.out = 4)


[1] "2015-11-04 12:00:00 EST" "2015-10-04 12:00:00 EDT"
[3] "2015-09-04 12:00:00 EDT" "2015-08-04 12:00:00 EDT"

## 第三方包
```shell
BiocManager::install("lubridate")
```

In [35]:
# library("package, help, pos = 2, lib.loc = NULL")
library("lubridate")



Attaching package: ‘lubridate’


The following objects are masked from ‘package:base’:

    date, intersect, setdiff, union




## 使用lubridate函数处理日期和时间数据：

In [43]:
# 创建年-月-日格式的日期
date_ymd <- ymd("2021-01-31")
print(date_ymd) # [1] "2021-01-31"

# 创建月-日-年格式的日期
date_mdy <- mdy("January 31st, 2021")
print(date_mdy) # [1] "2021-01-31"

# 创建日-月-年格式的日期
date_dmy <- dmy("31-Jan-2021")
print(date_dmy) # [1] "2021-01-31"

# 从整数创建日期
date_ymd_int <- ymd(20170131)
print(date_ymd_int) # [1] "2017-01-31"


[1] "2021-01-31"
[1] "2021-01-31"
[1] "2021-01-31"
[1] "2017-01-31"


In [44]:
# 设置时区为 UTC
datetime_with_tz <- ymd("2021-1-10", tz = "UTC")
print(datetime_with_tz) # [1] "2021-01-10 UTC"


[1] "2021-01-10 UTC"


In [36]:
# 创建日期对象
date_obj <- ymd("20220101")

# 提取日期对象的年份
year(date_obj)

# 提取日期对象的月份
month(date_obj)

# 提取日期对象的天数
day(date_obj)


In [45]:
## 创建时间
# 创建小时:分钟:秒格式的时间
time_hms <- hms("09:23:31")
print(time_hms) # [1] "9H 23M 31S"

# 创建年-月-日 时:分:秒格式的日期时间
datetime_ymd_hms <- ymd_hms("2021-1-5 5:12:39")
print(datetime_ymd_hms) # [1] "2021-01-05 05:12:39 UTC"

# 创建年-月-日 时:分格式的日期时间（秒可省略）
datetime_ymd_hm <- ymd_hm("2021-01-31 05:00")
print(datetime_ymd_hm) # [1] "2021-01-31 05:00:00 UTC"


[1] "9H 23M 31S"
[1] "2021-01-05 05:12:39 UTC"
[1] "2021-01-31 05:00:00 UTC"


In [37]:
# 创建日期时间对象
datetime_obj <- ymd_hms("20220101 12:00:00")

# 提取日期时间对象的小时数
hour(datetime_obj)

# 提取日期时间对象的分钟数
minute(datetime_obj)

# 提取日期时间对象的秒数
second(datetime_obj)


In [38]:
# 格式化日期对象
format(date_obj, "%Y-%m-%d")


In [39]:
# 计算日期之间的差值
date_diff <- difftime(ymd("20220101"), ymd("20220110"))
date_diff


Time difference of -9 days

In [41]:
datetime_obj


[1] "2022-01-01 12:00:00 UTC"

In [42]:
# 将日期时间对象转换为特定时区的日期时间对象
with_tz(datetime_obj, "America/New_York")


[1] "2022-01-01 07:00:00 EST"

## 转换数据类型创建日期时间

In [46]:
# 转换字符为日期时间
datetime_from_char <- as_datetime("2013-06-10 23:59:59")
print(datetime_from_char) # [1] "2013-06-10 23:59:59 UTC"

# 转换字符为日期
date_from_char <- as_date("2013/06/10")
print(date_from_char) # [1] "2013-06-10"

# 获取当前日期时间
current_datetime <- as_datetime(today())
print(current_datetime) # [1] 当前日期时间

# 获取当前日期
current_date <- as_date(now())
print(current_date) # [1] 当前日期


[1] "2013-06-10 23:59:59 UTC"
[1] "2013-06-10"
[1] "2024-08-22 UTC"
[1] "2024-08-22"


## 日期时间的四舍五入


In [52]:
mydatetime <- now()

# 四舍五入到最近的分钟
rounded_minute <- round_date(mydatetime, "minute")
print(rounded_minute) # [1] "2021-06-03 21:36:00 UTC"

# 向下取整到最近的天
floored_day <- floor_date(mydatetime, "day")
print(floored_day) # [1] "2021-06-03"

# 向上取整到最近的天
ceiled_day <- ceiling_date(mydatetime, "day")
print(ceiled_day) # [1] "2021-06-04"


[1] "2024-08-22 01:51:00 EDT"
[1] "2024-08-22 EDT"
[1] "2024-08-23 EDT"


## 设置日期时间的组件

In [53]:
mydatetime
# 设置日期时间的某个组件
mday(mydatetime) <- 10
print(mydatetime) # 日期设为10日

hour(mydatetime) <- hour(mydatetime) + 5
print(mydatetime) # 增加5个小时


[1] "2024-08-22 01:50:52 EDT"

[1] "2024-08-10 01:50:52 EDT"
[1] "2024-08-10 06:50:52 EDT"


ERROR: Error in hour.default(): argument "x" is missing, with no default


## 时间间隔与持续时间


In [61]:
today() - ymd("2001-01-01")


Time difference of 8634 days

In [58]:
# 创建 duration 对象
duration_obj <- as.duration(today() - ymd("2001-01-01"))
print(duration_obj) # 以秒为单位显示持续时间


[1] "745977600s (~23.64 years)"


In [59]:
# 创建 period 对象
period_obj <- years(1) + months(3) + days(20)
print(period_obj) # 显示年、月、日的时间段


[1] "1y 3m 20d 0H 0M 0S"


In [60]:
# 创建 interval 对象
interval_obj <- interval(ymd_hms("2009-01-01 00:00:00"), ymd_hms("2010-02-02 01:01:01"))
print(interval_obj) # 显示时间间隔


[1] 2009-01-01 UTC--2010-02-02 01:01:01 UTC


In [69]:
make_date(year = year(today()), month = month(today()), day = day(today()))


In [78]:
arrive <- ymd_hms("2020-12-04 12:00:00")
arrive

leave <- ymd_hms("2020-12-10 14:00:00")
leave

res <- interval(arrive, leave)
res <- arrive %--% leave
res


[1] "2020-12-04 12:00:00 UTC"

[1] "2020-12-10 14:00:00 UTC"