0基础学习PyFlink——时间滚动窗口(Tumbling Time Windows)_技术教程

在《0基础学习pyflink——个数滚动窗口(tumbling count windows)》一文中，我们了解到如果窗口内元素个数未达到设定窗口大小，计算个数的函数不会被触发。例如，下图中红色部分的元素（b,2）和（d,5）不会被计算：

为了让这些元素也能被计算，我们可以使用时间滚动窗口（Tumbling Time Windows）。这种窗口不依赖于元素的数量，而是基于时间进行触发。只要时间窗口到达，无论窗口内有多少元素，计算都会进行。

我们可以稍作修改《0基础学习PyFlink——个数滚动窗口(Tumbling Count Windows)》的示例，将元素集中在“A”上。以下是修改后的代码：

map代码语言：javascript

class SumWindowFunction(WindowFunction[tuple, tuple, str, TimeWindow]):
    def apply(self, key: str, window: TimeWindow, inputs: Iterable[tuple]):
        print(*inputs, window)
        return [(key,  len([e for e in inputs]))]
word_count_data = [("A",2),("A",1),("A",4),("A",3),("A",6),("A",5),("A",7),("A",8),("A",9),("A",10),
("A",11),("A",12),("A",13),("A",14),("A",15),("A",16),("A",17),("A",18),("A",19),("A",20)]
def word_count():
env = StreamExecutionEnvironment.get_execution_environment()
env.set_runtime_mode(RuntimeExecutionMode.STREAMING)
write all the data to one file
env.set_parallelism(1)
source_type_info = Types.TUPLE([Types.STRING(), Types.INT()])
# define the source
# mappging
source = env.from_collection(word_count_data, source_type_info)
# source.print()
# keying
keyed=source.key_by(lambda i: i[0])
reduce代码语言：javascript
    # reducing
reduced=keyed.window(TumblingProcessingTimeWindows.of(Time.milliseconds(2))) \
                .apply(SumWindowFunction(),
                    Types.TUPLE([Types.STRING(), Types.INT()]))
        # # define the sink
reduced.print()
# submit for execution
env.execute()
在这个例子中，我们使用了时间滚动窗口，窗口大小设置为2毫秒（Time.milliseconds(2)）。运行这段代码时，由于基于时间触发计算，每个元素都会被计算，输出结果可能会有所不同：

或

或

可以看出，结果并不稳定，但每条数据都会被计算，而不是像个数滚动窗口那样某些数据可能不会被触发。
完整代码如下：
from typing import Iterable
import time
from pyflink.common import Types, Time
from pyflink.datastream import StreamExecutionEnvironment, RuntimeExecutionMode, WindowFunction
from pyflink.datastream.window import TimeWindow, TumblingProcessingTimeWindows

class SumWindowFunction(WindowFunction[tuple, tuple, str, TimeWindow]):
def apply(self, key: str, window: TimeWindow, inputs: Iterable[tuple]):
print(*inputs, window)
return [(key,  len([e for e in inputs]))]
word_count_data = [("A",2),("A",1),("A",4),("A",3),("A",6),("A",5),("A",7),("A",8),("A",9),("A",10),
("A",11),("A",12),("A",13),("A",14),("A",15),("A",16),("A",17),("A",18),("A",19),("A",20)]
def word_count():
env = StreamExecutionEnvironment.get_execution_environment()
env.set_runtime_mode(RuntimeExecutionMode.STREAMING)
write all the data to one file
env.set_parallelism(1)
source_type_info = Types.TUPLE([Types.STRING(), Types.INT()])
# define the source
# mappging
source = env.from_collection(word_count_data, source_type_info)
# source.print()
# keying
keyed=source.key_by(lambda i: i[0])

# reducing
reduced=keyed.window(TumblingProcessingTimeWindows.of(Time.milliseconds(2))) \
                .apply(SumWindowFunction(),
                    Types.TUPLE([Types.STRING(), Types.INT()]))
        # # define the sink
reduced.print()
# submit for execution
env.execute()
if name == 'main':
word_count()

参考资料：https://www./link/dc61c1317e2c1637f0f8d2de7fd8da9b 
	



# ai 
# windows 
# 2025 
# red 
# python 
# apache 
 







相关栏目：
    【
        行业资讯    】
    【
        网络运营    】
    【
        GEO优化    】
    【
        营销推广    】
    【
        SEO优化    】
    【
        技术教程    】
    【
        代码知识    】
    【
        AI推广    】






相关推荐：
Win10怎么卸载鲁大师_Win10彻底卸载鲁大师方法【步骤】 
Win11怎么制作U盘启动盘_Win11原版系统安装盘制作【详解】 
Python装饰器设计思路_功能增强机制说明【指导】 
Windows10怎样连接蓝牙设备_Windows10蓝牙连接步骤【教程】 
Python网络日志追踪_请求定位解析【教程】 
如何使用Golang开发简单的聊天室消息存储_Golang WebSocket数据持久化方法 
Win11怎么更改默认打开方式_Win11关联文件格式教程【详解】 
php中常量能用::访问吗_类常量与作用域操作符使用场景【汇总】 
PythonPandas数据分析项目教程_时间序列透视表应用 
Python实现图数据库操作_Neo4j核心CRUD与图算法解析 
Win10如何更改电脑休眠时间_Windows10电源和睡眠选项调整 
Win11怎么卸载Photos应用_Win11卸载Photos应用方法【教程】 
MAC如何设置网卡MAC地址克隆_MAC终端修改物理地址与环境模拟【教程】 
win10无法切换用户 Win10无法切换账户解决方法 
php8.4如何实现队列任务_php8.4redis队列简单实现方法【教程】 
如何使用Golang安装依赖库_管理模块和第三方包 
Win11怎么把图标拖到任务栏_Win11固定应用快捷方式指南【方法】 
Python网络超时处理_健壮性设计说明【指导】 
Python对象比较与排序_集合使用说明【指导】 
Go语言中slice追加操作的底层共享机制详解 
Python类装饰器使用_元编程解析【教程】 
如何开启Windows的远程服务器管理工具(RSAT)？（管理服务器） 
php增删改查在php8里有什么变化_新特性对curd的影响【指南】 
如何在 Go 开发中正确处理本地包导入与远程模块路径的一致性问题 
如何在Golang中实现并发消息队列消费者_Golang channel消息消费实践 
Win10怎样清理C盘爱奇艺缓存_Win10清理爱奇艺缓存步骤【步骤】 
如何在 Go 项目开发中正确处理本地包导入与远程模块路径的一致性问题 
如何在 IIS 上为 ASP.NET 6 应用排除特定目录并交由 PHP 处理 
如何用::实现单例模式_php静态方法与作用域操作符应用【技巧】 
如何在Golang中修改数组元素_通过指针实现原地更新 
Windows10蓝屏代码DPC_WATCHDOG_VIOLATION_Win10死机修复指南 
Windows10系统怎么查看已安装更新_Win10控制面板卸载补丁 
Win10如何更改网络连接_Windows10以太网属性IP配置 
windows 10应用商店区域怎么改_windows 10微软商店切换地区方法 
php485能和物联网模块通信吗_php485对接NB-IoT模块实例【说明】 
php打包exe后无法读取环境变量_变量配置方法【教程】 
如何使用Golang处理静态文件缓存_提高页面加载速度 
Win11怎么设置默认邮件客户端 Win11修改Mail应用关联【教程】 
Python生成器表达式内存优化_惰性计算说明【指导】 
Win10怎样清理C盘Steam游戏缓存_Win10清理Steam游戏缓存步骤【步骤】 
Win11怎么恢复误删照片_Win11数据恢复工具使用【推荐】 
Win11怎么关闭防火墙通知_屏蔽Win11安全中心安全警告弹窗【技巧】 
Windows10电脑怎么查看硬盘通电时间_Win10使用工具检测磁盘健康 
Python面向对象实战讲解_类与设计模式深入理解 
Win11怎么设置组合键快捷方式_Windows11自定义快捷键操作 
Python模块的__name__属性如何由导入方式决定？ 
短链接怎么自定义还原php_修改解码规则适配需求【汇总】 
Win10电脑C盘红了怎么清理_Windows10系统盘深度瘦身指南 
如何在Golang中捕获HTTP服务器错误_GolangHTTP Handler中error处理 
Mac如何使用听写功能_Mac语音输入打字【效率技巧】

17370845950

关于我们

服务项目

广告推广

案例欣赏